Com es gestionen i publiquen les dades de recerca

Beneficis de gestionar i compartir les dades de recerca

  • Validació de resultats.
  • Localització i comprensió de dades.
  • Redueix la duplicació de dades i els costos implicats.
  • Compleix els requisits de les convocatòries de recerca.
  • Promou el debat científic.
  • Promou la innovació i els nous usos potencials de les dades.
  • Fomenta la col·laboració entre usuaris i creadors de dades.
  • Augmenta l'impacte i la visibilitat de la investigació.
  • Augmenta la vostra reputació quan altres persones citen el vostre treball.

El Pla de gestió de dades de recerca

Què és un Pla de Gestió de Dades (PGD)?

Un Pla de gestió de dades (Data Management Plan - DMP) és un document formal que ha de descriure el cicle de vida de les dades tant durant un projecte de recerca com quan aquest s’hagi acabat. L’objectiu del PGD és que es considerin aspectes com ara la metodologia i els estàndards que s’empraran per a gestionar les dades, com es compartiran, com es conservaran i com es preservaran en el futur.

El Pla de gestió de dades no és un document definitiu, sinó que va evolucionant al llarg del projecte de recerca. Les especificacions per a elaborar un PGD per a un projecte H2020 es poden consultar a: Guidelines on Data Management in Horizon 2020 (Annex 1 i 2). Horizon 2020 actualment demana el dipòsit i la preservació de les dades (incloent-hi les metadades associades) necessàries per a validar els resultats d’una recerca presentats en les publicacions científiques.

 

Com s'elabora un PGD?

 

Plantilla per fer un pla de gestió de dades seguint els requisits del Programa H2020:

Aquest document ha estat elaborat pel Grup de Treball de Suport a la Recerca del CSUC.

 

On puc trobar exemples de PGD?

Plans de gestió de dades desenvolupats amb DMP Online o altres eines.

Com pots treballar amb les dades de recerca

Com es descriuen les dades? Conjunts de dades (datasets), estàndards i metadades

La descripció de les dades hauria d’incloure la informació necessària per tal d’entendre i analitzar les nostres dades o reproduir els resultats d’aquí a vint anys.

  • Origen de les dades: si les dades es generen dins el projecte o bé si són recol·lectades. En cas que les dades siguin recol·lectades, cal indicar la font d’on s’han extret.
  • Tipologia i format de les dades de recerca (dades observacionals, experimentals, computacionals, etc.)
  • Estàndards: cal indicar quin estàndard de metadades es farà servir.
  • Metadades de descripció: les metadades haurien de respondre preguntes del tipus:
  • Què són les dades?
  • Qui les pot fer servir?
  • Quan es poden fer servir?
  • Com es poden fer servir?
  • Amb quina finalitat es poden fer servir?
  • On es poden trobar?
  • Quant temps estaran disponibles?

 

Quins són els aspectes legals sobre la protecció de dades?

La protecció de les dades personals inclou la protecció de les llibertats i els drets fonamentals de les persones físiques aplicats a un projecte d’R+D+I, i també la seva protecció davant la possible utilització per tercers no autoritzats.

 

Quins són els aspectes ètics sobre la protecció de dades?

Els aspectes ètics afecten les dades que es poden mostrar, el temps i l’anonimat de les persones implicades, i respecten la dignitat i la integritat per a garantir-ne la privadesa i la confidencialitat.

Recursos i documentació relacionada:

 

Amb quina llicència pots publicar les teves dades?

El document Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 explicita:

«As far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited.»

 

Trobaràs més informació a:

 

Com se citen les dades?

DataCite estableix que les dades s’han de citar de la mateixa manera que citem altres fonts d’informació bibliogràfica, com ara articles o llibres.

Citar les dades de recerca et permetrà:

  • Reutilitzar les dades fàcilment i, a més, verificar-les
  • Fer seguiment de l’impacte que puguin tenir les dades
  • Crear una estructura acadèmica que reconegui i recompensi els productors de dades

 

Models d’estructura:

  1. Creador (any de publicació): Títol. Editor. Identificador.
  2. Creador (any de publicació): Títol. Versió. Editor [Tipus de recurs]. Identificador.

Nota: l’identificador correspon a DOI, Handle o URL permanent (preferiblement enllaçable).

 

Exemples de citació de dades (font Datacite):

Irino, T; Tada, R (2009): Chemical and mineral compositions of sediments from ODP Site 127‐797. Geological Institute, University of Tokyo

Geofon operator (2009): GEFON event gfz2009kciu (NW Balkan Region). GeoForschungsZentrum Potsdam (GFZ)

Denhard, Michael (2009): dphase_mpeps: MicroPEPS LAF‐Ensemble run by DWD for the MAP D‐PHASE project. World Data Center for Climate

Publica en data journals o revistes de dades en obert

En els darrers anys hi ha un interès creixent per publicar les dades de recerca en obert per tal d’afavorir la transparència, la visibilitat i l’impacte de la recerca, així com garantir l’accés a les dades de forma lliure i gratuïta, i assegurar-ne la preservació, explotació i reproducció.

En aquest context, han sorgit els Data Journals o revistes de dades que comprenen dues tipologies principals:

  1. Publicació de dades com article de dades (o data paper): ssón revistes on només es publiquen dades en forma d’article de dades (data papers). Són un nou format de publicació centrat en el conjunt de dades.

  2. Publicació de dades juntament amb l’article (o enriched/enhanced publication): són revistes que presenten, conjuntament, articles i dades. Habitualment, aquest tipus de revistes no recullen les dades completes sinó que recomanen on s’han de dipositar (a repositoris de dades concrets) i enllacen a aquests repositoris des dels articles.

Alguns exemples de revistes de dades són les editorials següents:

  • Nature Publishing Group: Nature Publishing Group: els autors poden enviar el seu conjunt de dades a dipòsits de dades, per disciplines i reconeguts per la comunitat, inclosos en el seu llistat.
  • Ubiquity Press (sèrie d’accés obert): ofereix la xarxa de repositoris d’accés obert Dataverse

Doneu una ullada a la recopilació de data journals següent, segons la seva àrea temàtica, tipus d’accés i impacte científic en els índex internacionals més rellevants.

 

​On es poden dipositar les dades de recerca?

Per a seleccionar un repositori on es poden dipositar les dades de recerca, recomanem tenir en compte les consideracions següents:

  • Considerar l’àmbit temàtic (hi ha repositoris multidisciplinaris i temàtics) i l’ambit geogràfic.
  • Identificar quin tipus de dades es tenen (programari, imatges, dades sense tractar, etc.)
  • Identificar si les dades són obertes, embargades, restringides o tancades.
  • Tenir en compte la mida aproximada dels fitxers de dades.
  • Tenir en compte la llicència amb la qual es volen difondre les dades.
  • Identificar si cal fer servir identificadors permanents (DOI, Handle).

És recomanable utilitzar recursos europeus per a assegurar-se que compleixen la llei de protecció de dades.

 

Quins són els repositoris de dades multidisciplinaris més destacables i quines característiques tenen?

Repositoris de dades multidisciplinars:

Repositoris i portals de dades de ciències socials: 

També pots consultar la taula comparativa de repositoris, elaborada per la Biblioteca de la Universitat Autònoma de Barcelona o bé la llista de repositoris que manté la Biblioteca de l'Erasmus University.