Actualidad

Los datos de investigación en la Nube

Temática:  Multidisciplinar
Varios servidores y, supuerpuesto, un diagrama de una red conectada a la Nube
Wed Dec 20 12:11:00 CET 2017

Rosa Padrós asiste al EOSC Stakeholder Forum para conocer los avances en una herramienta europea para recuperar datos de investigación en abierto.

La capacidad de los archivos de tu móvil y ordenador se miden en megabytes y gigabytes. En el Big data se utiliza una unidad de medida muy diferente, el petabyte (1024 terabytes) el equivalente a 13,3 años de Hd video. En este laberinto de datos, ¿cómo gestionar la información? Éste es precisamente uno de los retos del Open Science: ¿cómo se pueden gestionar los datos generar durante un proyecto de investigación?

En este contexto nace EOSC, una infraestructura europea que se concibe como el «sistema de los sistemas» ya que aglutina diferentes funciones vinculadas a las «infraestructuras de investigación, infraestructuras electrónicas i proveedores de servicio». La nube europea «aprovechará las capacidades existentes y dará soporte a la reutilización de datos científicos, superando las barreras disciplinarias sociales y geográficas».

Estas son algunas de las ideas que destaca Rosa Padrós, bibliotecaria de apoyo a la investigación y corresponsable del O2 repositorio, que del 28 al 29 de noviembre asistió al congreso EOSC Stakeholder Forum. Un encuentro entre grupos de interés científico (miembros de agencias de evaluación, gestores de investigación, investigadores, técnicos y bibliotecarios) para conocer más detalles acerca de la nube EOSC. Hablamos con Padrós para conocer las claves de la gestión de datos en abierto.

«No solo publicaciones, no solo datos y no solo en el ámbito europeo»

Las 3 O: Open Innovation, Open Science y Open tono the World

En el marco del programa europeo H2020, los proyectos financiados con fondos públicos europeos tendrán que publicar en abierto tanto las publicaciones como los datos generados durante el proceso de investigación como por ejemplo, las respuestas de una encuesta o las pruebas de un experimento. Tal y como explica Padrós, «hay un cambio de paradigma, se pasa del Open Access al OpenScience. La frase Open Innovation, Open Science and Open tono the World lo define muy bien. No sólo publicaciones, no sólo datos y no sólo en el ámbito europeo».

¿Qué es un Plan de Gestión de Datos (PGD)?

El investigador tiene que elaborar un PGD, un documento en el que se describe el ciclo de vida de los datos: «cómo se identificarán, como se describirán, con quién se compartirán y qué se depositará en abierto y qué no. No se puede olvidar el principio As open as posible, as closed as necessary, hay que publicar con el menor número de restricciones, pero protegiendo siempre los datos sensibles».

«Hay trabajo, es un reto y el papel de la Biblioteca es clave»

Las bibliotecas, motores del cambio

La última edición de la Informe Horizon Report, Library edition señala la gestión de datos de la investigación como una de las tendencias más inmediatas para las bibliotecas académicas y de investigación, tal y como se concluye en el Informe «los métodos de generación de datos y la capacidad de almacenar grandes cantidades crecen constantemente».

¿Qué retos representa publicar datos en abierto para la Biblioteca de la UOC?

«Hasta ahora velábamos por el cumplimiento de los mandatos de acceso abierto en cuanto a las publicaciones científicas, artículos, capítulos... pero ahora también tenemos que apoyar a los investigadores en el momento de publicar sus datos de investigación, con la complejidad que comporta (diversidad de formatos, volumen de los ficheros...). El reto es incorporar estos nuevos mandatos dentro de las dinámicas de trabajo de las bibliotecas y para ello es esencial la formación, tenemos que aprender nuevos vocabularios de metadatos, nuevos estándares, implementar políticas de gestión de datos, conocer y utilizar herramientas más allá de los repositorios institucionales…Hay trabajo, es un reto y el papel de la Biblioteca es clave».

¿Cuáles son los beneficios de compartir los datos en abierto?

«Hay muchos pero podría destacar dos. Ayuda a incrementar el impacto y la visibilidad de la investigación y favorecer la colaboración entre los usuarios de datos y sus creadores. Por ejemplo, si haces un experimento científico y no funciona, compartir los datos utilizados es fantástico porque permitirá a otros investigadores partir de estos resultados para hacer nuevas pruebas y, por lo tanto, reducir la duplicidad de recogida de datos y los costes asociados a ella. Esta es la filosofía del acceso abierto».

Recuerda que la Biblioteca de la UOC dispone de un servicio de apoyo para elaborar el Plan de gestión de datos e información para elegir el repositorio más adecuado para depositarlos.