Com es gestionen les dades de recerca

Pas 1: Pla de gestió de dades de recerca

 

Què és un PGD?

Un Pla de gestió de dades (Data Management Plan - DMP) és un document formal que ha de descriure el cicle de vida de les dades tant durant un projecte de recerca com quan aquest s’hagi acabat. L’objectiu del PGD és que es considerin aspectes com ara la metodologia i els estàndards que s’empraran per a gestionar les dades, com es compartiran, com es conservaran i com es preservaran en el futur.

 

El Pla de gestió de dades no és un document definitiu, sinó que va evolucionant al llarg del projecte de recerca. Les especificacions per a elaborar un PGD per a un projecte H2020 es poden consultar a: Guidelines on Data Management in Horizon 2020 (Annex 1 i 2). Horizon 2020 actualment demana el dipòsit i la preservació de les dades (incloent-hi les metadades associades) necessàries per a validar els resultats d’una recerca presentats en les publicacions científiques.

 

Com s'elabora un PGD?

Plantilla per fer un pla de gestió de dades seguint els requisits del Programa H2020:

Aquest document ha estat elaborat pel Grup de Treball de Suport a la Recerca del CSUC.

 

On puc trobar exemples de PGD?

Casos d’èxit de plans de gestió de dades desenvolupats amb DMP Online o altres eines.

 

Pas 2: Treballar amb les dades de recerca

 

Com es descriuen les dades? Conjunts de dades (datasets), estàndars i metadades

La descripció de les dades hauria d’incloure la informació necessària per tal d’entendre i analitzar les nostres dades o reproduir els resultats d’aquí a vint anys.

 

Conjunts de dades: cal referenciar i anomenar cada conjunt de dades. La descripció de cada conjunt de dades hauria d’incloure la informació següent:

  • Origen de les dades: si les dades es generen dins el projecte o bé si són recol·lectades. En cas que les dades siguin recol·lectades, cal indicar la font d’on s’han extret.
  • Tipologia i format de les dades de recerca (dades observacionals, experimentals, computacionals, etc.)
  • Estàndards: cal indicar quin estàndard de metadades es farà servir.
  • Metadades de descripció: les metadades haurien de respondre preguntes del tipus:
  • Què són les dades?
  • Qui les pot fer servir?
  • Quan es poden fer servir?
  • Com es poden fer servir?
  • Amb quina finalitat es poden fer servir?
  • On es poden trobar?
  • Quant temps estaran disponibles?

 

Quins són els aspectes legals sobre la protecció de dades?

La protecció de les dades personals inclou la protecció de les llibertats i els drets fonamentals de les persones físiques aplicats a un projecte d’R+D+I, i també la seva protecció davant la possible utilització per tercers no autoritzats.

 

Quins són els aspectes ètics sobre la protecció de dades?

Els aspectes ètics afecten les dades que es poden mostrar, el temps i l’anonimat de les persones implicades, i respecten la dignitat i la integritat per a garantir-ne la privadesa i la confidencialitat.

 

Recursos i documentació relacionada:

 

Amb quina llicència pots publicar les teves dades?

El document Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 explicita:

«As far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited.»

 

Trobaràs més informació a:

Com se citen les dades?

DataCite estableix que les dades s’han de citar de la mateixa manera que citem altres fonts d’informació bibliogràfica, com ara articles o llibres.

Citar les dades de recerca et permetrà:

  • Reutilitzar les dades fàcilment i, a més, verificar-les
  • Fer seguiment de l’impacte que puguin tenir les dades
  • Crear una estructura acadèmica que reconegui i recompensi els productors de dades

Models d’estructura:

  1. Creador (any de publicació): Títol. Editor. Identificador.
  2. Creador (any de publicació): Títol. Versió. Editor [Tipus de recurs]. Identificador.

 

Nota: l’identificador correspon a DOI, Handle o URL permanent (preferiblement enllaçable).

 

Exemples de citació de dades (font Datacite):

 

Irino, T; Tada, R (2009): Chemical and mineral compositions of sediments from ODP Site 127‐797. Geological Institute, University of Tokyo

Geofon operator (2009): GEFON event gfz2009kciu (NW Balkan Region). GeoForschungsZentrum Potsdam (GFZ)

Denhard, Michael (2009): dphase_mpeps: MicroPEPS LAF‐Ensemble run by DWD for the MAP D‐PHASE project. World Data Center for Climate

Pas 3: Repositoris - Arxiu i reutilització de les dades de recerca

 

​On es poden dipositar les dades de recerca?

Per a seleccionar un repositori on es poden dipositar les dades de recerca, recomanem tenir en compte les consideracions següents:

 

  • Considerar l’àmbit temàtic (hi ha repositoris multidisciplinaris i temàtics) i l’ambit geogràfic.
  • Identificar quin tipus de dades es tenen (programari, imatges, dades sense tractar, etc.)
  • Identificar si les dades són obertes, embargades, restringides o tancades.
  • Tenir en compte la mida aproximada dels fitxers de dades.
  • Tenir en compte la llicència amb la qual es volen difondre les dades.
  • Identificar si cal fer servir identificadors permanents (DOI, Handle).

 

Amb aquesta informació, es recomana consultar el directori de repositoris re3data.org i filtrar segons els interessos (àmbit temàtic, país, etc.).

Quins són els repositoris de dades multidisciplinaris més destacables i quines característiques tenen?

 

​Beneficis de gestionar i compartir dades

  • Validació dels resultats obtinguts.
  • Localització i comprensió de les dades.
  • Reducció de la duplicitat de recollida de dades i els costs que això comporta.
  • Acompliment dels requisits de les convocatòries de recerca.
  • Foment del debat científic.
  • Foment de la innovació i els nous usos potencials de les dades.
  • Afavoriment de la col·laboració entre els usuaris de dades i els seus creadors.
  • Increment de l’impacte i la visibilitat de la recerca.
  • Augment de la pròpia reputació quan els altres citin l’obra pròpia.