Gestión de datos de investigación
Fernando Ariel López (CAICYT-CONICET) [email protected]
Lorena Carlino (CONICET) [email protected]
#JVAA2016 #AccesoAbierto #OAW16
Fernando Ariel López (CAICYT - CONICET, Argentina)
•Coordinador Comunicación y Formación / CAICYT-CONICET•Director de Biblioteca / UMET•Co-Fundador y Director / Aprender 3C•Integra el proyecto de investigación sobre Acceso Abierto / IIGG-UBA•Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA)•Autor y Coordinador Comunicaciones / InfoTecarios•Evaluador en diversas revistas científicas y congresos profesionales.
Expositor, Consultor y Formador en Acceso Abierto al conocimiento científico (Repositorios y Revistas Digitales), Ciencia Abierta (Datos científicos y Plan de Gestión de Datos), Ciencia 2.0, Web social, Tecnologías de Información y Comunicación, Alfabetización Informacional, Alfabetizador Digital, etc.
Lorena Carlino (CONICET, CABA, Argentina)
Actualmente tiene a su cargo la Oficina Técnica Central de Repositorios Institucionales del CONICET. Es Licenciada en Bibliotecología y Documentación (UMSA), Especialista en Comunicación Institucional (Universidad Austral). Se ha involucrado en la gestión de la información digital y el uso compartido de la información. Lleva adelante la ejecución de entornos de acceso abierto, el intercambio de datos de investigación y la implementación de sistemas interoperables para facilitar y acercar el conocimiento.
BIG DATA REDES SOCIALES + IOT
+ Smart City
CIENCIA Ciencia AbiertaGOBIERNO Gobierno Abierto
LEGISLACIÓN• LEY 26.899 (2013)Creación de Repositorios Digitales Institucionales de
Acceso Abierto, Propios o Compartidos
• RESOLUCIÓN 538 de JFG (2013)Sistema Nacional de Datos Públicos
• DECRETO 117 (2016) Plan de Apertura de Datos
• Ley Acceso a la Información Pública (2016)
Acceso a la Información Pública
→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado,
→ pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba.
Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras.
En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.”
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
● Es una colección de datos reunidos durante la ejecución de un proyecto de investigación.
● Son objetos digitales compuestos y heterogéneos.● Constituye la base de la investigación y va asociado a una
publicación científica (resultado de la investigación).● Se almacena y gestiona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de control, organización,
descripción y preservación de datos científicos
DATASET
BENEFICIOS #DatosAbiertos● Ayuda a verificar los resultados.● Evitar la fabricación y falsificación de datos.● Diferentes interpretaciones o enfoques
aplicados a datos existentes contribuyen a los avances científicos.
● Optimización en el uso de recursos.● Preservación a largo plazo bien gestionada,
permite mantener la integridad de los datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101
http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
CIENCIA
Líneas de Trabajo:
1.POLÍTICA DE DATOS CIENTÍFICOS
2.CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
3.PLAN DE GESTIÓN DE DATOS CIENTÍFICOS
4.E-INFRAESTRUCTURAS
1. Diseño y planificación de la creación/extracción de datos
2. Creación/Extracción de Datos
3. Limpieza, Normalización y Descripción de Datos
4. Almacenamiento y Preservación de Datos
5. Exploración, Explotación y Visualización de Datos
6. DataMining & Knowledge Discovery
CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
¿Qué es un PGD?Un plan de gestión de datos científicos (Data Management Plan - DMP) es un documento elaborado por el investigador o grupo de investigación donde se define:
•qué datos van a ser creados y cómo,
•cómo se van a describir, organizar, almacenar y gestionar los datos
•de qué forma van a ser compartidos, explicando cualquier restricción de
uso que pueda ser aplicada.
•Quién o quiénes serán los responsables de realizar cada una de estas
actividades.
•de qué forma van a ser compartidos, explicando cualquier restricción de
uso que pueda ser aplicada.
DMP Argentina (CAICYT-CONICET)
Propuesta para Proyecto de Investigación:•Bloque de Datos administrativos•Bloque de Recolección de datos•Bloque de Documentación y metadatos•Bloque de Almacenamiento y copias de seguridad •Bloque de Selección y preservación•Bloque de Re-uso de Datos
e-INFRAESTRUCTURAS Repositorio Interoperable de Datos•Datos Públicos Argentina (CKAN, OKF),•Zenodo (Invenio, CERN)•DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),•Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores•OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
NUEVOS PERFILES
La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísticos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos.
Data Scientist / Científicos de Datos
Bibliotecari@ de Datos / Data Librarian
Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.
El perfil del bibliotecario de datos requiere:•Competencias informáticas•Conocimiento de la disciplina (corpus, prácticas de investigación y flujos de trabajo)•Gestión de datos:
adquisición (desarrollo de la colección), organización (catalogación y metadatos), preservación y conservación a largo plazo implementación de servicios adecuados para
los usuarios.
NUEVAS COMPETENCIAS
COMPETENCIAS
• Estadística, Algebra y Programación
• Tecnologías y Formatos Abiertos
• XML, PYTHON, R, etc.
• Herramientas de normalización, procesamiento
y visualización.
• Comunicación (visual y audiovisual)
• Diseño Centrado en el Usuario (UX)
Ley 26.899
• DESARROLLAR REPOSITORIOS DIGITALES INSTITUCIONALES DE ACCESO ABIERTO
• ESTABLECER POLÍTICAS • PRESENTACIÓN DE UN PLAN DE GESTIÓN• DEPOSITO DE DATOS PRIMARIOS COLECTADOS Y DE LA
PRODUCCIÓN RESULTANTE DE INVESTIGACIONES FINANCIADAS CON FONDOS PÚBLICOS EN ESOS REPOSITORIOS
http://ri.conicet.gov.ar/
ri.conicet.gov.ar
PROMEDIO+2.900
VISITAS/MES+38.000VISITAS/AÑO
GOOGLECONICETRI
+7000ARTÍCULOS
ri.conicet.gov.ar
BUSCADORES
WEBCONICET
RI
TRAFICO
HACIA EL DESARROLLO DE UN REPOSITORIO DE DATOS DE INVESTIVACIÓN
REPOSITORIO DE DATOS
POLÍTICAS Y ESTRATEGIAS
PLAN DE GESTIÓN DE DATOS
METADATOS GENÉRICOS Y
DOCUMENTACIÓN
DESARROLLO DE PLATAFORMA
Gerencia de Organización y Sistemas
Gerencia de Desarrollo
Ciclo de los datos de
investigación
Fuente: infografía REBIUN - CRUE
Ciclo de los datos de
investigación
Y sobre todo…Es una herramienta para el investigador
¿QUÉ ES UN PLAN DE GESTION DE DATOS?
Es un documento que permite conocer el tratamiento que van a recibir los datos recopilados o generados en el curso de una investigación.
quiénes están involucrados en el flujo de los datos de investigación;
cuáles son sus prácticas, necesidades y límites a la hora de compartir sus datos;
qué datos se están generando, cómo se están almcenando y qué grado de grado de apertura tendrán ;
PILOTO – PGD CONICET
JULIO 2016 LANZAMIENTO DE UN PILOTO PGD CONICET42 PROYECTOS UE INVITADOS20 PROYECTOS UE VOLUNTARIOS
OBJETIVOEvaluar el contenido del PGD
Conocer el tratamiento de los datosRelevar el interés y las necesidades
ALGUNOS RESULTADOS…
PILOTO PGD - CONICET
TIPOS DE DATOS
USO DE ESTANDARES
VOLUMEN
DONDE PONDRÁ ACCESIBLE SUS DATOS
50% REQUIEREN SOPORTE O CAPACITACIÓN75% CONSIDERA APROPIADA LA ORGANIZACIÓN DEL CONTENIDO60% ASUMEN COMO NECESIDAD LA GESTION DE UN PGD50% REQUIERE MÁS INFORMACIÓN ACERCA DEL USO DE ESTÁNDARES Y ESQUEMAS DE METADATOS
IMPLEMENTACIONPlan de Gestión de Datos
ENTORNO WEBCAPACITACIÓN•Diseño del Sitio Web - FAQ•Contenido informativo y de consulta•Talleres online•Instalación del DMP seleccionado•Sinergia con MinCyT
2016 - 2017
ENCUESTA DEL PILOTO – PGD CONICET
¿Problemas?
SOMOS GRANDES LECTORES DE ACCESO ABIERTO yPOCO AUTORES DE ACCESO ABIERTO
AUTOARCHIVO
¿Soluciones?
Acompasar el cambio mostrando los beneficios de la apertura tanto institucionalmente como de quienes son productores
GENERAR CONCIENCIAABRIR EN ACCION
Incrementa la citación
Uso y reuso, velocidad y reaprovechamiento
Almacenamiento y preservación
Obtención de Indicadores y tendencias más reales
Eleva el factor de impacto
Aumenta la Visibilidad individual e Institucional
Localización sistemática de la información
Mejoras en la calidad de la investigación
Uso de estándares e identificadores unívocos
Ahorro de fondos públicos
GENERAR CONCIENCIAGESTIONAR EL CAMBIO EFECTIVAMENTE
MARCO ADECUADO CONFIANZA BENEFICIOS
Leyes PolíticasLineamientos
Sistemas amigablesPlataformas robustasUso de estándaresActualización permanenteResguardos
Aumento de la visibilidadIncremento de citacionesPreservación Localización organizadaSin duplicidad de esfuerzos
SERVICIOS
Capacitación Mesa de AyudaProveer Recursos
Muchas Gracias
Top Related