Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema:...
Transcript of Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema:...
CURSO AVANZADO DE GESTIOacuteN Y DIFUSIOacuteN EN ACCESO ABIERTO DE DATOS DE INVESTIGACIOacuteN
Isabel Bernal
Oficina Teacutecnica de DIGITALCSIC URICI
12 - 13 de marzo 2018 CSIC
TIPOS DE DATOS DE INVESTIGACIOacuteN
Primer problema ldquoiquestde queacute datos hablamosrdquo (12)
bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData
bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data
Primer problema ldquoiquestde queacute datos hablamosrdquo (22)
bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)
bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript
Concordat on Open Research Data
Tipos de datos cualitativos
bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)
bull Field notes (including from participant observation or ethnography)
bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic
public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes
queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records
bull Court records legal documents (charts wills contracts)
bull Chronicles autobiographies memoirs travel logs diaries
bull Brochures posters flyers
bull Press releases newsletters annual reports
bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission
statements bull Party platforms bull Personal documents (letters personal
diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper
articles) bull Electronic media bull Published collections of documents
gazeteers yearbooks etc bull Books articles dissertations working
papers bull Photographs bull Ephemera popular culture visual or audio
materials (printed cloth art music songs etc)
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
TIPOS DE DATOS DE INVESTIGACIOacuteN
Primer problema ldquoiquestde queacute datos hablamosrdquo (12)
bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData
bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data
Primer problema ldquoiquestde queacute datos hablamosrdquo (22)
bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)
bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript
Concordat on Open Research Data
Tipos de datos cualitativos
bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)
bull Field notes (including from participant observation or ethnography)
bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic
public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes
queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records
bull Court records legal documents (charts wills contracts)
bull Chronicles autobiographies memoirs travel logs diaries
bull Brochures posters flyers
bull Press releases newsletters annual reports
bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission
statements bull Party platforms bull Personal documents (letters personal
diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper
articles) bull Electronic media bull Published collections of documents
gazeteers yearbooks etc bull Books articles dissertations working
papers bull Photographs bull Ephemera popular culture visual or audio
materials (printed cloth art music songs etc)
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Primer problema ldquoiquestde queacute datos hablamosrdquo (12)
bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData
bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data
Primer problema ldquoiquestde queacute datos hablamosrdquo (22)
bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)
bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript
Concordat on Open Research Data
Tipos de datos cualitativos
bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)
bull Field notes (including from participant observation or ethnography)
bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic
public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes
queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records
bull Court records legal documents (charts wills contracts)
bull Chronicles autobiographies memoirs travel logs diaries
bull Brochures posters flyers
bull Press releases newsletters annual reports
bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission
statements bull Party platforms bull Personal documents (letters personal
diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper
articles) bull Electronic media bull Published collections of documents
gazeteers yearbooks etc bull Books articles dissertations working
papers bull Photographs bull Ephemera popular culture visual or audio
materials (printed cloth art music songs etc)
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Primer problema ldquoiquestde queacute datos hablamosrdquo (22)
bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)
bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript
Concordat on Open Research Data
Tipos de datos cualitativos
bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)
bull Field notes (including from participant observation or ethnography)
bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic
public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes
queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records
bull Court records legal documents (charts wills contracts)
bull Chronicles autobiographies memoirs travel logs diaries
bull Brochures posters flyers
bull Press releases newsletters annual reports
bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission
statements bull Party platforms bull Personal documents (letters personal
diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper
articles) bull Electronic media bull Published collections of documents
gazeteers yearbooks etc bull Books articles dissertations working
papers bull Photographs bull Ephemera popular culture visual or audio
materials (printed cloth art music songs etc)
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Tipos de datos cualitativos
bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)
bull Field notes (including from participant observation or ethnography)
bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic
public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes
queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records
bull Court records legal documents (charts wills contracts)
bull Chronicles autobiographies memoirs travel logs diaries
bull Brochures posters flyers
bull Press releases newsletters annual reports
bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission
statements bull Party platforms bull Personal documents (letters personal
diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper
articles) bull Electronic media bull Published collections of documents
gazeteers yearbooks etc bull Books articles dissertations working
papers bull Photographs bull Ephemera popular culture visual or audio
materials (printed cloth art music songs etc)
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search
bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers
bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the
description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data
httpswwwforce11orgfairprinciples
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Repositorios de datos
httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp
httpszenodoorg
2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN
1 PARA CUALQUIER AUTOR
Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories
Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Distintos tipos de enfoques
Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq
El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Recursos de intereacutes
bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)
bull Glosario sobre datos de Science Europe
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
En la praacutectica los investigadores quierenhellip
ldquoNecesito urgentemente un DOI para mi
datasetrdquo
ldquoNecesito que los revisores
de mi artiacuteculo accedan a mi
datasetrdquo
ldquoNecesito 1 TB para mi datasetrdquo
ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Y DIGITALCSIC tambieacuten quiere
Metadatos de calidad
Gestioacuten de copyright
Buenas praacutecticas cientiacuteficas
bull Metadatos completos y significativos
bull Suficiente informacioacuten contextual
bull Ficheros limpios
bull Formatos estaacutendar
bull Claras licencias de uso
bull Versionado
bull Atribucioacuten completa a todos los autores del dataset
bull Referencias a datos ajenos si procede
Dataset con metadatos
completos y a ser posible en
acceso abierto
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica
de datos yo a proyectos H2020
Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones
Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy
largo recorrido
Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC
ITEMS INDIVIDUALES
Tipologiacuteas de recursos (dctype)
bull Dataset
bull Imagen
bull Mapas
bull Video
bull Documentos de trabajohellip
bull Con uno o maacutes ficheros
COLECCIONES DE DATOS
bull Estacioacuten Bioloacutegica de Dontildeana (EBD)
bull Instituto de Ciencias del Mar (ICM)
bull Instituto de Ciencias de Patrimonio (INCIPIT)
bull Instituto de Historia (IH)
bull Instituto de Investigaciones Marinas (IIM)
bull Instituto Pirenaico de Ecologiacutea (IPE)
bull Etcetera
COLECCIONES ESPECIALES
bull Colecciones del Proyecto Au
bull Coleccioacuten de Base de datos de Misioacuten de Irlanda
bull Variedades frutales de hueso y pepita
bull Etceacutetera
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Viacuteas de carga de datos en DIGITALCSIC
CARGAS AUTOMATIZADAS
bull Gestionadas por la Oficina Teacutecnica del repositorio
bull Importacioacuten masiva de metadatos y ficheros
bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga
bull Esencial la colaboracioacuten de los productores de datos
CARGAS MANUALES
bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores
bull En general son datasets (1 o maacutes ficheros) en 1 solo item
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Plantilla de descripcioacuten de datos en DIGITALCSIC
iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el
tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido
eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema
estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen
asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que
hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos
de los datos iquestLas palabras clave son suficientemente descriptivas y
especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se
encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos
Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles
Mapeo Dublin Core-DataCite
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Mapeo con el esquema de metadatos de DataCite
httpsschemadataciteorg
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes
Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523
Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo
ARTIacuteCULO
DATASET
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas descripcioacuten en ingleacutes
Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones
httpsdigitalcsiceshandle10261139347
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas citacioacuten seguacuten Principios FORCE11
bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto
bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal
bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)
bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final
httpsdigitalcsiceshandle10261140497
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)
bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX
bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud
bull httpsdigitalcsiceshandle10261139347
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)
httpsdigitalcsiceshandle10261156967
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas referencia a datos ajenos reutilizados
bull Item httpsdigitalcsiceshandle10261140497
Dcrelationisbasedon
E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)
bull Item httpsdigitalcsiceshandle10261141218
Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas Metadatos sobre software y formatos
Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas fichero readme significativo
bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas
bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt
bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada
bull httpsdigitalcsiceshandle10261135062
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas informacioacuten sobre la licencia de uso
bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899
bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40
bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES
ITEM httpsdigitalcsiceshandle10261106217
bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40
CASO 3 DATASET COMPLEJOHETEROGENEO
ITEM httpsdigitalcsiceshandle10261103342
bull Dcdescription
The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0
bull httpsopendatacommonsorgfaqlicensesdb-versus-contents
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buenas praacutecticas denominacioacuten consistente de ficheros
Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003
mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la
denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Otros esquemas de metadatos para datos por disciplinas
httpwwwdatacarpentryorglessons
httprd-alliancegithubiometadata-directorysubjects
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Descripcioacuten de software bull La descripcioacuten de un software debe ser
suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented
bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86
bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados
bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra
bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Citacioacuten de software casuiacutesticas
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Ejemplos de software
bull httpasclnet1505015
bull httpasclnetdashboard
bull httpcamsmseufledusoftware1
bull httplodiulaupfeduresources237
bull httpsgithubcomexplore
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Software en DIGITALCSIC
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Formatos de datos recomendaciones
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Formatos con vistas a la preservacioacuten a largo plazo
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Recomendaciones a favor de la reusabilidad
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Recomendaciones a favor de la
replicabilidad
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Preservacioacuten de software recursos de intereacutes
PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestTodos los datos estaacuten protegidos por copyright
bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright
bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright
bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten
bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe
bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)
bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten
bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona
bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Propiedad Intelectual legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Gestioacuten de datos puacuteblicos legislacioacuten baacutesica
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias Creative Commons
httpsenwikipediaorgwikiCreative_Commons_license
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Selector de licencias Creative Commons
bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten
40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos
bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo
bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes
bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias OpenData Commons
1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia
bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)
bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto
2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet
reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando
bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso
3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio
puacuteblico
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias Creative Commons y datosbases de datos
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias Open Data Commons y datosbases de datos
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias Creative Commons para datos y ldquoOpen Sciencerdquo
bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)
bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos
bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito
bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento
bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)
bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de
copyright
httpwwwweb2rightscomOERIPRSupportcreativecommons
httpwwwweb2rightscomOERIPRSupportrisk-management-calculator
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Herramientas para elegir licencia para software
Software licenses in context of copyright according to Mark Webbink
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Asistente de licencia de datossoftware
bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software
bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector
bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Licencias restrictivas
Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158
OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Privacidad de datos legislacioacuten baacutesica
httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
La gama de datos seguacuten tipo de acceso
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestQueacute son los datos personales
bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person
bull El Reglamento General de Proteccioacuten de Datos (GDPR)
Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten
Europea y fuera
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica
bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary
bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice
bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes
bull httpswwwncbinlmnihgovpmcarticlesPMC5243137
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Eacutetica en la gestioacuten de datos
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestQueacute son los datos sensibles
Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las
que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal
bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten
bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten
El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye
bull Anonimizacioacuten de los datos
bull Asignacioacuten de un nuacutemero al estudio y al proyecto
bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten
bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave
bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Tratamiento de datos personales pasos
Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard
4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Consideraciones sobre el consentimiento de publicacioacuten de datos
bull El consentimiento informado es un
requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados
bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario
bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-
decisiontoolsorgukconsentexampleshtml
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Poliacuteticas nacionales en Europa
bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten
bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos
bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes
bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas
bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto
httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Integridad en la investigacioacuten
bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Poliacutetica de datos de la Comisioacuten Europea (programa H2020)
Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los
resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible
2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Resumiendo
bull Queacute datos 1 estadiacutesticas resultados de
experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes
2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto
bull Queacute maacutes Un plan de gestioacuten de datos
bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto
bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data
bull Cuaacutendo tan pronto como sea posible
bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite
bull Queacute licencias Recomendadas las licencias CC-BY CC-0
bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto
bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Pasos para los proyectos H2020
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Requerimientos en gestioacuten de datos en un proyecto H2020
Preparar un Plan de Gestioacuten de Datos
Decidir queacute datos se ofreceraacuten en modo abierto
Elegir un repositorio de datos
Asignar licencias de uso a los datos
Usar estaacutendares internacionalesde la
comunidad cientiacutefica para promover la
interoperabilidad en la web
Dar metadatos a los datos para facilitar su
descubrimiento acceso y uso
Indicar queacute herramientassoftware son
necesarios para permitir verificacioacuten y replicabilidad
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Datos de investigacioacuten en nuevo Plan Estatal
bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias
bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial
bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Inventarios de poliacuteticas de datos de agencias financiadoras
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
PLANES DE GESTIOacuteN DE DATOS
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestPara queacute sirven los Planes de Gestioacuten de Datos
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission
bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs
bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment
bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent
bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies
bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Una chuleta para crear planes de gestioacuten de datos
Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura
estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y
confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Algunos protocolos para crear planes de gestioacuten de datos por disciplinas
bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades
bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina
bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos
bull iexcliexclNo recomendar que los investigadores inventen la rueda
httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Ejemplos de planes por disciplinas
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Hacia Planes de Gestioacuten de Datos inteligentes
bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores
bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras
instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y
personas bull Planes uacutetiles para cualquier tipo de resultado de
proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA
FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Prototipos de planes de datos inteligentes
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Planes de gestioacuten de software iquestpor queacute y coacutemo
bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto
bull Mejor continuidad del proyecto si los miembros del quipo cambian
bull Mejor estimacioacuten y planificacioacuten de los recursos
bull Reduccioacuten del riesgo en la gestioacuten del proyecto
bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)
bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con
publicaciones pueda conservarse para futura validacioacuten y reproducibilidad
bull Aumenta la visibilidad e impacto potencial del software
bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan
httpswwwsoftwareacukresourcesguidessoftware-management-plans
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
DATOS Y REVISTAS
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestQueacute son las revistas de datos (12)
bull Revistas que aceptan artiacuteculos que describen datasets
bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo
-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos
DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestQueacute son las revistas de datos (22)
APCs y Factor de impacto de una seleccioacuten de revistas de datos
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Buscador de poliacuteticas de revistas para datos abiertos
-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
El auge de las revistas que publican software
bull Estos artiacuteculos suelen contener
bull - Una introduccioacuten
bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso
bull - Resultados
bull - Casos de aplicacioacuten
bull - Discusioacuten
bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1
bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software
bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas
bull El potencial de usar los softwares en distintos tipos de proyectos
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
DATOS Y SERVICIOS DE VALOR ANtildeADIDO
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo
big data) a lo largo de todo su ciclo de vida
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
EOSC-hub Nube europea de ciencia abierta
Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Monitorizacioacuten de datos abiertos en Europa
VIDEO de presentacioacuten httpsyoutubecGx__qndBjA
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Gestioacuten de datos y ciencia abierta
bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo
proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y
meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
iquestEl futuro
bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy
bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data
httpswwwbig-data-europeeu
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
La diversificacioacuten de meacutetricas de impacto
httpwwwmetrics-toolkitorg
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar
Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders
Solicitud de financiacioacuten a Wellcome Trust
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Impacto de datasets en los perfiles de DIGITALCSIC
httpsdigitalcsicescrisrprp05861
httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Especiales sobre datos en CSIC Abierto
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Estadiacutesticas de DataCite para datasets de DIGITALCSIC
bull Estadiacutesticas sobre el uso online de los datasets con DOIs
bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Seguimiento de impacto de los datasets en GBIF
The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia
GRACIAS Isabelbernalbibcsices
GRACIAS Isabelbernalbibcsices