En aquesta biblioguia recollim les eines que tens a la teva disposició per gestionar les dades de recerca.
Gestió de les dades de recerca
La importància de la gestió de les dades en l'àmbit de la recerca ha augmentat els darrers anys, juntament amb la possibilitat de difondre-les i compartir-les amb altres investigadors i investigadores i amb el públic en general.
Gestió de dades de recerca a la UOC
La gestió de les dades de recerca (RDM) engloba l'organització, l'estructura, l'emmagatzematge i el tractament de les dades utilitzades o generades durant un projecte de recerca.
Està present en totes les fases d'una recerca:
- Creació de dades i planificació de la reutilització
- Processament i organització: estructuració i metadades
- Anàlisi
- Preservació: seguretat, accés, emmagatzematge i recuperació
- Compartició: per publicar i ser citat/ada
- Reutilització
El Pla de gestió de dades de recerca
Què és un Pla de Gestió de Dades (PGD)?
Un pla de gestió de dades (data management plan, DMP) és un document formal que descriu el cicle de vida de les dades tant durant un projecte de recerca com quan aquest ja ha acabat.
L'objectiu del PGD és que es considerin aspectes com ara la metodologia i els estàndards que s'han d'emprar per gestionar les dades, compartir-les, conservar-les i preservar-les en el futur.
El pla de gestió de dades no és un document definitiu, sinó que va evolucionant al llarg del projecte de recerca.
Com s'elabora un PGD?
Eines
Programa desenvolupat pel Digital Curation Centre, Regne Unit. Disposa d'una plantilla per a projectes H2020. S'hi poden consultar els diferents manuals i seminaris en línia sobre l'eina i les preguntes més freqüents.
Quins són els aspectes legals sobre la protecció de dades?
La protecció de les dades personals inclou la protecció de les llibertats i els drets fonamentals de les persones físiques aplicats a un projecte d'R+D+I, i també la seva protecció davant la possible utilització per part de tercers no autoritzats.
Quins són els aspectes ètics sobre la protecció de dades?
Els aspectes ètics afecten les dades que es poden mostrar, el temps i l'anonimat de les persones implicades, i en respecten la dignitat i la integritat per garantir-ne la privadesa i la confidencialitat.
Recursos i documentació relacionada:
Amb quina llicència pots publicar les teves dades?
El document Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 explicita:
«As far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited.»
En pots trobar més informació a:
Com se citen les dades?
DataCite estableix que les dades s’han de citar de la mateixa manera que citem altres fonts d’informació bibliogràfica, com ara articles o llibres.
Citar les dades de recerca permet:
- Reutilitzar les dades fàcilment i, a més, verificar-les.
- Fer seguiment de l’impacte que puguin tenir les dades.
- Crear una estructura acadèmica que reconegui i recompensi els productors de dades.
Models d’estructura:
- Creador (any de publicació): Títol. Editor. Identificador.
- Creador (any de publicació): Títol. Versió. Editor [Tipus de recurs]. Identificador.
Nota: l’identificador correspon a DOI, Handle o URL permanent (preferiblement enllaçable).
Per a més informació:
On es publiquen les dades de recerca?
Data journals o revistes de dades en obert
Els darrers anys hi ha un interès creixent per publicar les dades de recerca en obert per tal d'afavorir la transparència, la visibilitat i l'impacte de la recerca, i també per garantir l'accés a les dades de manera lliure i gratuïta i assegurar-ne la preservació, l'explotació i la reproducció.
En aquest context, han sorgit els data journals o revistes de dades, que comprenen dues tipologies principals:
- Publicació de dades com a article de dades (o data paper): són revistes on només es publiquen dades en forma d'article de dades (data papers). Són un nou format de publicació centrat en el conjunt de dades.
- Publicació de dades juntament amb l'article (o enriched/enhanced publication): són revistes que presenten, conjuntament, articles i dades. Habitualment, aquest tipus de revistes no recullen les dades completes, sinó que recomanen on s'han de dipositar (a repositoris de dades concrets) i enllacen a aquests repositoris des dels articles.
Alguns exemples de revistes de dades són les editorials següents:
Els autors i les autores poden enviar el conjunt de dades a dipòsits de dades, per disciplines i reconeguts per la comunitat, inclosos en la seva llista.
Ofereix la xarxa de repositoris d'accés obert Dataverse.
Recopilació de data journals, segons la seva àrea temàtica, tipus d’accés i impacte científic en els índex internacionals més rellevants.
Repositoris
- Al repositori consorciat CORA. Repositori de Dades de Recerca. Aquest repositori té com a objectiu la publicació de les dades de recerca de tota la comunitat UOC. Per publicar les teves dades de recerca a aquest repositori, posa't en contacte amb el servei de gestió de dades de recerca.
- En un repositori temàtic. Consulta quin és el més adequat a Re3data, Registry of Research Data Repositories.
- En altres repositoris multidisciplinaris. Consulta la taula comparativa de repositoris elaborada per la Biblioteca de la Universitat Autònoma de Barcelona.
Què són les dades de recerca?
La Comissió Europea (CE) defineix les dades de recerca com la informació factual o numèrica recollida per a ser examinada i considerada com la base d’un raonament, d’una discussió o d’un càlcul. Les dades inclouen estadístiques, resultats d’experiments, mesures i observacions resultants de l’estudi de camp, d’enquestes o d’entrevistes i imatges.
Un relat de ficció com a guia fidel als principis FAIR per a les dades d'investigació.
Tipus de dades de recerca
- Observacionals: dades capturades en temps real. Per exemple, neuroimatges, dades de mostres, dades de sensors, dades d’enquesta.
- Experimentals: dades capturades en equips de laboratori. Per exemple, seqüències de gens, cromatogrames, dades de camps magnètics.
- Simulació: dades generades a partir de models de prova. Per exemple, climatològiques, matemàtiques o models econòmics.
- Derivades o compilades: dades reproduïbles, però de difícil reproducció. Per exemple, de text i mineria de dades, models 3D, bases de dades compilades.
- De referència: conglomerat o conjunt de dades. Per exemple, bancs de dades de seqüències de gens, estructures químiques o portals de dades espacials.
Beneficis de gestionar i compartir les dades
- Validació dels resultats obtinguts.
- Localització i comprensió de les dades.
- Reducció de la duplicitat de recollida de dades i els costs que això comporta.
- Acompliment dels requisits de les convocatòries de recerca.
- Foment del debat científic.
- Foment de la innovació i els nous usos potencials de les dades.
- Afavoriment de la col·laboració entre els usuaris de dades i els seus creadors.
- Increment de l’impacte i la visibilitat de la recerca.
- Augment de la pròpia reputació quan els altres citin l’obra pròpia.
En qui recau l’autoria de les dades?
Segons l’article 12 de la Llei de propietat intel·lectual:
Les bases de dades: «que per la selecció o disposició dels seus continguts constitueixin creacions intel·lectuals» estan protegides per drets d’autor.
No obstant això, les dades en brut incloses dins una base de dades no tenen autoria, per tant, no són objecte de propietat intel·lectual.
Entitats finançadores i dades de recerca
H2020
La Comissió Europea estableix que tots els projectes finançats mitjançant el projecte Horitzó 2020 (H2020) han d'elaborar un pla de gestió de dades (data management plan, DMP) i compartir les dades de manera tan oberta com sigui possible. A més, cal que les dades siguin FAIR, és a dir, trobables (findable), accessibles (accessible), interoperables (interoperable) i reutilitzables (reusable).
Per a les accions finançades pel Consell Europeu de Recerca (ERC, per la sigla en anglès), consulteu el document Guidelines on Implementation of Open Access to Scientific Publications and Research Data in projects supported by the European Research Council under Horizon 2020.
Pla estatal 2017-2020
Amb la finalitat d'impulsar l'accés a les dades de recerca dels projectes d'R+D+I finançats, el Pla estatal de recerca científica i tècnica i d'innovació 2017-2020 menciona incloure, amb caràcter optatiu:
Un pla de gestió de dades que s'haurà de dipositar en dipòsits institucionals, nacionals o internacionals un cop finalitzat el projecte i transcorregut el termini establert a les convocatòries corresponents, respectant sempre totes les situacions en les quals les dades s'hagin de protegir per raons de confidencialitat, seguretat, protecció o quan sigui necessari per a l'explotació comercial dels resultats obtinguts.