Cómo gestionar y publicar los datos de investigación

Beneficios de gestionar y compartir los datos de investigación

  • Validación de resultados.
  • Localización y comprensión de datos.
  • Reduce la duplicación de datos y los costes implicados.
  • Cumple los requisitos de las convocatorias de investigación.
  • Promueve el debate científico.
  • Promueve la innovación y los nuevos usos potenciales de los datos.
  • Fomenta la colaboración entre usuarios y creadores de datos.
  • Aumenta el impacto y la visibilidad de la investigación.
  • Aumenta tu reputación cuando otras personas citan su trabajo.

Plan de gestión de datos de investigación

¿Qué es un PGD?

Un Plan de gestión de datos (Data Management Plan - DMP) es un documento formal que debe describir el ciclo de vida de los datos tanto durante un proyecto de investigación como cuando este haya finalizado. El objetivo del PGD es que se consideren aspectos como la metodología y los estándares que se emplearán para gestionar los datos, cómo se compartirán, cómo se conservarán y cómo se preservarán en el futuro.

El Plan de gestión de datos no es un documento definitivo, sino que va evolucionando a lo largo del proyecto de investigación. Las especificaciones para elaborar un PGD para un proyecto H2020 pueden consultarse en: Guidelines on Data Management in Horizon 2020 (Annexo 1 y 2). Horizon 2020 actualmente solicita el depósito y la preservación de aquellos datos (incluidos los metadatos asociados) necesarios para validar los resultados de una investigación presentados en las publicaciones científicas.

 

¿Cómo se elabora un PGD?

Herramientas y recursos que tienes a tu alcance y que te ayudarán a redactar tu PGD:

 

Plantilla para realizar un plan de gestión de datos según los requisitos del Programa H2020:

Este documento ha sido elaborado por el Grupo de Trabajo de Apoyo a la Investigación del CSUC.

 

​¿Dónde puedo encontrar ejemplos de PGD?

Casos de éxito de planes de gestión de datos desarrollados con DMP Online u otras herramientas.

Trabajar con los datos de investigación

¿Cómo se describen los datos? Conjuntos de datos (datasets), estándares y metadatos

La descripción de los datos debería incluir la información necesaria para entender y analizar nuestros datos o reproducir los resultados de aquí a veinte años.

  • Conjuntos de datos: hay que referenciar y nombrar cada conjunto de datos. La descripción de cada conjunto de datos debería incluir la siguiente información:
  • Origen de los datos: si los datos se generan dentro del proyecto o bien si son recolectados. En caso de que los datos sean recolectados, es necesario indicar la fuente de donde se han extraído.
  • Tipología y formato de los datos de investigación (datos observacionales, experimentales, computacionales, etc.)
  • Estándares: hay que indicar el estándar de metadatos que se utilizará.
  • Metadatos de descripción: los metadatos deberían responder a preguntas del tipo:
  • ¿Qué son los datos?
  • ¿Quién los puede utilizar?
  • ¿Cuándo pueden utilizarse?
  • ¿Cómo pueden utilizarse?
  • ¿Con qué finalidad pueden utilizarse?
  • ¿Dónde pueden encontrarse?
  • ¿Cuánto tiempo estarán disponibles?

 

​¿Cuáles son los aspectos legales sobre la protección de datos?

La protección de los datos personales incluye la protección de las libertades y los derechos fundamentales de las personas físicas aplicados a un proyecto de I+D+I, así como su protección ante la posible utilización por terceros no autorizados.

 

​¿Cuáles son los aspectos éticos sobre la protección de datos?

Los aspectos éticos afectan a los datos que pueden mostrarse, el tiempo y el anonimato de las personas implicadas, y respetan la dignidad y la integridad para garantizar su privacidad y confidencialidad.

Recursos y documentación relacionada:

 

​¿Con qué licencia puedes publicar los datos?

El documento Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 explicita:

«As far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited.»

 

Encontrarás más información en:

 

¿Cómo se citan los datos?

DataCite establece que los datos deben citarse igual que citamos otras fuentes de información bibliográfica, como artículos o libros.

Citar los datos de investigación te permitirá:

  • Reutilizar los datos fácilmente y, además, verificarlos
  • Hacer un seguimiento del impacto que puedan tener los datos
  • Crear una estructura académica que reconozca y recompense a los productores de datos

 

Modelos de estructura:

  1. Creador (año de publicación): Título. Editor. Identificador.
  2. Creador (año de publicación): Título. Versión. Editor [Tipo de recurso]. Identificador

Nota: el identificador corresponde a DOI, Handle o URL permanente (preferiblemente enlazable).

 

Ejemplos de citación de datos (fuente Datacite):

Irino, T; Tada, R (2009): Chemical and mineral compositions of sediments from ODP Site 127-797. Geological Institute, University of Tokyo 

Geofon operator (2009): GEFON event gfz2009kciu (NW Balkan Region). GeoForschungsZentrum Potsdam (GFZ). 

Denhard, Michael (2009): dphase_mpeps: MicroPEPS LAF-Ensemble run by DWD for the MAP D-PHASE project. World Data Center for Climate

Publica en data journals o revistas de datos en abierto

En los últimos años se ha dado un interés creciente por publicar los datos de investigación en abierto con el fin de favorecer la transparencia, la visibilidad y el impacto de la investigación, así como garantizar el acceso a los datos de forma libre y gratuita; asegurando su preservación, explotación y reproducción.

En este contexto, han aparecido los Data Journals o revistas de datos que comprenden dos tipologías principales:

  1. Publicación de datos como artículos de datos (o data paper): son revistas donde sólo se publican datos en forma de artículo de datos (data papers). Son un nuevo formato de publicación centrado en el conjunto de datos.
  2. Publicación de datos juntamente con el artículo (o enriched/enhanced publication): son revistas que presentan, conjuntamente, artículos y datos. Habitualmente, este tipo de revistas no recogen los datos completos si no que recomiendan donde se deben depositar (en repositorios de datos concretos) y enlazan a estos desde los artículos.

Algunos ejemplos de revistas de datos son las editoriales siguientes:

  • Nature Publishing Group: los autores pueden enviar su conjunto de datos a depósitos de datos, por disciplinas y reconocidos por la comunidad, incluídos en su listado.
  • Ubiquity Press (serie de acceso abierto): ofrece la red de repositorios de acceso abierto Dataverse. Echad un vistazo a la siguiente selección de data journals, según el área temática, tipo de acceso e impacto científico en los índices internacionales más relevantes.

Echad un vistazo a la siguiente selección de data journals, según el área temática, tipo de acceso e impacto científico en los índices internacionales más relevantes. 

 

¿Dónde se pueden depositar los datos de investigación?

Para seleccionar un repositorio donde depositar los datos de investigación, recomendamos tener en cuenta las siguientes consideraciones:

  • Considerar el ámbito temático (hay repositorios multidisciplinares y temáticos) y el ámbito geográfico.
  • Identificar el tipo de datos que de que se dispone (software, imágenes, datos sin tratar, etc.)
  • Identificar si los datos son abiertos, embargados, restringidos o cerrados.
  • Tener en cuenta el tamaño aproximado de los archivos de datos.
  • Tener en cuenta la licencia con la que quieren difundirse los datos.
  • Identificar si hay que utilizar identificadores permanentes (DOI, Handle).

Es recomendable utilizar recursos europeos para asegurarse que cumplen con la ley de protección de datos.

​¿Cuáles son los repositorios de datos multidisciplanes más destacables y qué carectísticas tienen?

Repositorios de datos multidisciplinarios:

Repositoris i portals de dades de ciències socials:

También puedes consultar la tabla comparativa de repositorios, elaborada por la Biblioteca de la Universidad Autónoma de Barcelona o bien la lista de repositorios que mantiene la Biblioteca de la Erasmus University.