Les dades de recerca en el núvol

Temàtica:  Multidisciplinar
Diversos servidors i, a sobre, un diagrama d'una xarxa connectada al núvol
20/12/17

Rosa Padrós assisteix a l’EOSC Stakeholder Forum per a conèixer els avenços d’una eina europea per a recuperar dades de recerca en obert.

La capacitat dels arxius del teu mòbil i ordinador es mesuren en megabytes i gigabytes. En les dades massives s’utilitza una unitat de mesura ben diferent, el petabyte (1.024 terabytes), l’equivalent a 13,3 anys de vídeo HD. En aquest laberint de dades, com es pot gestionar la informació? Així, doncs, un dels reptes de la ciència oberta és saber com es poden gestionar les dades produïdes durant un projecte de recerca.

En aquest context neix l’EOSC, una infraestructura europea que es concep com el sistema de sistemes perquè aglutina diferents funcions vinculades a : infraestructures de recerca, infraestructures electròniques i proveïdors de servei. El núvol europeu «aprofitarà les capacitats existents i donarà suport a la reutilització de dades científiques travessant barreres disciplinàries socials i geogràfiques».

Aquestes són algunes de les idees que destaca Rosa Padrós, bibliotecària de suport a la recerca i corresponsable de l’O2 repositori. Del 28 al 29 de novembre va assistir al congrés EOSC Stakeholder Forum, una trobada entre grups d’interès científic (membres d’agències d’avaluació, gestors de recerca, investigadors, tècnics i bibliotecaris) per a conèixer més detalls de l’EOSC. Parlem amb Padrós per a conèixer les claus de la gestió de dades en obert.

«No només publicacions, no només dades i no només en l’àmbit europeu»

Les tres o: open innovation, open science i open to the world

En el marc del programa europeu H2020, els projectes finançats amb fons públics europeus han de publicar en obert tant les publicacions com les dades generades durant el procés de recerca, com ara les respostes d’una enquesta o les proves d’un experiment. Tal com explica Padrós «hi ha un canvi de paradigma: es passa de l’accés obert a la ciència oberta. La frase Open innovation, open science and open to the world ho defineix molt bé. No només publicacions, no només dades i no només en l’àmbit europeu».

Què és un pla de gestió de dades (PGD)?

L’investigador ha d’elaborar un PGD, un document en què es descriu el cicle de vida de les dades: «com s’identificaran, com es descriuran, amb qui es compartiran i quines es dipositaran en obert i quines no. No es pot oblidar el principi «tan obert com sigui possible, tan tancat com sigui necessari»: cal publicar amb el nombre més baix de restriccions possible, però protegint les dades sensibles».

Les biblioteques, motors del canvi

En l’última edició de l’informe «Horizon Report Library Edition» s’assenyala la gestió de dades de la recerca com una de les tendències més immediates per a les biblioteques acadèmiques i de recerca. Tal com es recull a l’informe, «els mètodes de generació de dades i la capacitat d’emmagatzemar-ne grans quantitats creixen constantment».

«Hi ha feina, és un repte i el paper de la Biblioteca de la UOC és clau»

Però quins reptes representa publicar dades en obert per a la Biblioteca de la UOC?

«Fins ara vetllàvem pel compliment dels mandats d’accés obert pel que fa a les publicacions científiques, articles, capítols, etc., però ara hem de poder donar suport als investigadors també a l’hora de publicar les seves dades de recerca amb la complexitat que això comporta (diversitat de formats, volum dels fitxers, etc.). El repte és incorporar aquests nous mandats dins les dinàmiques de treball de les biblioteques, i per a això és essencial la formació: hem d’aprendre nous vocabularis de metadades, nous estàndards, implementar polítiques de gestió de dades, conèixer i utilitzar eines més enllà dels repositoris institucionals, etc. Hi ha feina, és un repte i el paper de la Biblioteca de la UOC és clau».

Quins són els beneficis de compartir les dades en obert?

«N’hi ha molts, però en podria destacar dos: que ajuda a incrementar l’impacte i la visibilitat de la recerca i que afavoreix la col·laboració entre els usuaris de dades i els seus creadors. Per exemple, si fas un experiment científic i no funciona, compartir les dades utilitzades és fantàstic perquè permetrà a altres investigadors partir d’aquests resultats per a fer noves proves; per tant, es redueix la duplicitat de recollida de dades i els costos associats. Aquesta és la filosofia de l’accés obert».

Recorda que la Biblioteca de la UOC disposa d’un servei de suport per a elaborar el PGD i informació per a triar el repositori més adequat per a dipositar les dades.

Editat per

Experts