Acceso abierto y principios FAIR

conceptos
antecedente
Autor/a

Miguel Equihua

Fecha de publicación

Xalapa, Ver., 25 marzo 2024

Como resultado de la reflexión que tuvimos en la mesa sobre datos abiertos, encontramos importante explorar los temas que aquí se presentan.

La preparación, oferta y mantenimiento de datos abiertos es parte de los intereses en búsqueda de una ciencia abierta. En este sentido conviene considerar los principios de la iniciativa de Budapest, Hungría en torno a publicación abierta. Esta iniciativa fue publicada el 14 de febrero 2002. Especialmente importante resulta la recomendación de desarrollar capacidades de “self-archiving” siguiendo estándares de la iniciativa de repositorios abiertos. Aunque esta última propuesta ya nos está en desarrollo activo, fue el antecedente que dio origen al estándar ANSI/NISO Z39.99-2017 para el acceso bibliográfico. De aquí emerge tamién el protocolo de cosecha de metadatos OAI-PMH, cuyas especificaciones continúan vigentes, y tiene nuevos desarrollos o actualizaciones como el ANSI/NISO 2017 aunque no se trata necesariamente de un reemplazo. De la iniciativa de Budapest emerge una guía interesante en torno al establecimiento de repositorios institucionales (de publicaciones). En su propio manifiesto del 2023, REDALYC refrenda los valores enunciados en la iniciativa de Budapest.

En México se han tenido expresiones positivas en torno a esta iniciativa desde su aparición en 2002. Por ejemplo, del Senado de la República, la UNAM, UAEM, CONACYT y la UAM, entre otras. Si bien la iniciativa de Budapest se enfoca en la publicación abierta, resulta claro que no basta con tener acceso a la publicación como producto final de las investigaciones, se requiere compartir también los datos base de los estudios, como se explica en esta nota de Verhulst, Zahuranec & Young (2021), que retoma parte de la serie “Great Stories of Open Science” que se publica con el apoyo del Ministerio Francés de Educación Superior, Investigación e Innovación

 

Actualmente, la opción vigente para datos abiertos nos conduce a los principios FAIR, que son un conjunto de recomendaciones para la gestión y cuidado de los datos científicos . La sigla FAIR se propone como adjetivo para calificar a los datos científicos como contenido digital, en virtud de su Findability, Accessibility, Interoperability, and Reuse. Existe el sitio goFAIR que promueve la adopción de estos principios.

Un ejemplo del proceso de adopción de los principios FAIR se presenta en el reporte aparecido en 2018 de la experiencia europea: Turning FAIR into reality: final report and action plan from the European Commission expert group on FAIR data, Publications Office. En este mismo sentido y en la confluencia de esfuerzos que impulsan los valores de la ciencia abierta esta también SPARC, que es una organización Norteamericana con filiales en Europa, África y Japón, sin fines de lucro. Promueve el desarrollo de sistemas para la investigación y la educación que sean abiertos en forma predeterminada y equitativos por diseño. La experiencia europea de SPARC ha producido documentos útiles como referencia y fuente de inspiración:


A la par de los atributos que definen la calidad y apertura práctica de los datos, hay que considerar la necesidad de mantenerlos en las mejores condiciones posibles, es decir curarlos. Al respecto, son importantes las recomendaciones que ofrece el Digital Curation Center. El lema que anima a esta organización es suficientemente elocuente: ¡Porque la buena investigación necesita buenos datos!.

Esta misma organización ofrece orientación para la definición de metadatos por áreas del conocimiento, lo que resulta muy útil. La página ofrece colecciones de estándares existentes y ayudan así al interesado a conocer las diversas aproximaciones que se han ensayado.

De acuerdo con los criterios que emanan de los principio FAIR, los datos pueden estar en distintos niveles de acceso abierto. Así, se puede definir la escalera de estructuración y acceso. En el nivel más simple encontramos datos contenidos en documentos de texto, por ejemplo PDF. En el otro extremo, con plena accesibilidad digital, están los verdaderos datos abiertos que cumplen a plenitud con los criterio FAIR.



Ejemplos de soluciones de datos abiertos

Uniatmos

Es la Unidad de Informática para las Ciencias Atmosféricas y Ambientales gestionada por el Instituto de de la Atmósfera y Cambio Climático de la UNAM.

Zenodo

Se trata de un espacio construido y desarrollado por investigadores, para garantizar que todo el mundo pueda participar en la Ciencia Abierta. El proyecto OpenAIRE fue desarrollado por indicaciones la Comunidad Europea para apoyar su incipiente política de Datos Abiertos. Con esta plataforma se ofrece un repositorio general para la investigación financiada por la Comnidad Europea. El CERN, socio de OpenAIRE y pionero en código abierto, acceso abierto y datos abiertos, proporcionó esta capacidad para lograr que Zenodo estuviera en operación a partir de mayo de 2013. En apoyo de su programa de investigación, el CERN ha desarrollado herramientas para la gestión de Big Data y ha ampliado las capacidades de la biblioteca digital para Open Data. A través de Zenodo, estas herramientas de Big Science pueden así compartirse eficazmente.

Datadryad

Es una plataforma de publicación de datos abiertos y una comunidad comprometida con la disponibilidad abierta y la reutilización rutinaria de todos los datos de investigación.

Figshare

Es un repositorio en el que los usuarios pueden poner a disposición todos los resultados de sus investigaciones de forma que se puedan citar, compartir y descubrir.

Metadatos y ejemplos de datos abiertos

Unión Europea: datos abiertos

Metadatos ámbito biológico: Darwin Core

Metadatos ámbito ciencias de la Tierra ISO-19115

La documentación de los metadatos cartográficos que utiliza Conaio sigue los estándares definidos en FGDC (1998) y FGDC (1999). De acuerdo con lo qe nos explicó el Ing. Fernández, el estándar de metadatos FGDC ha sido remplazado actualmente por el ISO-19115.

Otros ejemplos con datos climáticos y ambientales en general

Datos abiertos para principiantes

El grupo Safe Software produjo este libro electrónico, que explica en forma sencilla asuntos importantes a tener en cuenta.

Mantenlo simple

Inicia con asuntos pequeños, simples y de solución rápida. No hay necesidad de correr a abrir todos los datos de inmediato. Hacer de acceso abierto un conjunto pequeño de datos o parte del big data es suficiente para empezar y ganar experiencia.

Involucrarse pronto y hacerlo frecuentemente

Hay que acercarse tan pronto como sea posible a los usuarios reales y potenciales. Hay que pensar en quienes podrían utilizar los datos para crear otros productos de información. Estos actores pueden ser ciudadanos, empresarios, desarrolladores o intermediarios.

Atender los miedos y malos entendidos comunes

Esto es especialmente importante si estas trabajando con o dentro de una institución grande como suelen ser las áreas gubernamentales. Cuando se trata de abrir los acervos de datos es de esperar que surjan muchas preguntas, dudas y temores. Es importante identificar los más importantes de ellos y enfrentarlos de inmediato.