Propuesta para mesa redonda sobre Datos Abiertos

avances de proyectos estratégicos del Inecol

conceptos
datos
propuestas
Autor/a

Miguel Equihua

Fecha de publicación

Xalapa, Ver., 20 marzo 2024

Preguntas guía para la mesa

  1. ¿Cómo deberíamos proceder para generar una política y lineamientos para almacenar y hacer operables los datos abiertos que produce la comunidad del Inecol?

  2. ¿Qué acciones prácticas debemos emprender para crear y operar un repositorio de Datos Abiertos Inecol?

Para propiciar una reflexión amplia pero también productiva, consideramos importante considerar las siguientes ideas como marco de referencias para contextualizar las aportaciones.

Características de los datos abiertos

Los datos abiertos de carácter público se caracterizan por estar preparados para ser accesibles para el consumo humano directo, pero también para ser procesados por medios digitales. Por lo mismo, son accesibles en línea, y pueden ser usados, reutilizados y redistribuidos por cualquier interesado. Los datos abiertos están disponibles en formatos cómodos, modificables y abiertos que pueden recuperarse, descargarse, indexarse y buscarse. La posibilidad de procesarlos por medios digitales implica que los formatos deben ser legibles por máquina (es decir, los datos deben estar razonablemente estructurados para permitir un procesamiento automatizado). Las estructuras de datos abiertas no discriminan a ninguna persona o grupo de personas y deben ponerse a disposición del mayor número posible de usuarios para los fines más diversos. En la medida en que lo permita la ley, estos formatos no deben estar protegidos por derechos de propiedad intelectual, deben estar a disposición del público y no debe imponerse ninguna restricción a su uso, aunque esto no implica la falta de cortesía que exige acreditar adecuadamente a las fuentes y a quienes se dieron a la tarea de obtener los datos y que deben reconocerse como autores. Un resumen de puntos importantes es la siguiente lista de características mínimas:

  1. Gratuitos: Se obtendrán sin entregar a cambio contraprestación alguna.
  2. No discriminatorios: Serán accesibles sin restricciones de acceso para los usuarios.
  3. De libre uso: Citar la fuente de origen es el único requerimiento para ser utilizados libremente.
  4. Legibles por máquinas: Deberán estar estructurados, total o parcialmente, para ser procesados e interpretados por equipos electrónicos de manera automática.
  5. Integrales: Deberán contener, en la medida de lo posible, el tema que describen a detalle y con los metadatos necesarios.
  6. Primarios: Provendrán de la fuente de origen con el máximo nivel de desagregación posible.
  7. Oportunos: Serán actualizados periódicamente, conforme se generen.
  8. Permanentes: Se deberán conservar en el tiempo, para lo cual, las versiones históricas relevantes para uso público, se mantendrán disponibles a través de identificadores adecuados para tal efecto.
  9. Descritos: Contarán con una descripción completa, de modo que los consumidores de los mismos dispongan de información suficiente para comprender sus puntos fuertes, puntos débiles, limitaciones analíticas, requisitos de seguridad, así como la forma de procesarlos.

Aunque no son los únicos promotores de la idea de datos abiertos, hay un consorcio mundial que los promueve. Es el Open Data Charter, que ha producido mucho material interesante. Otro grupo interesante es el GovLab, que se interesa en la gobernanza y el impacto de enfoques abierto y colaorativos en la toma de decisiones informadas. De ellos obtuvimos y tradujimos la tabla periódica de los datos abiertos, que se muestra en la Figura 1.



Figura 1: Tabla periódica de los datos abiertos

Intereses que podríamos compartir

  1. Comunicación de los análisis estadísticos
  2. Al presentar los resultados de un análisis estadístico al público general, deberíamos considerar por igual cómo se facilita hacerlos disponibles confiablemente y como pueden presentarse para ser comprendidos de mejor manera.
  3. Análisis estadístico en beneficio de las comunidades locales.
    1. Podemos o consideran de interés involucrarse en el análisis formal (estadístico) de datos que son de interés para las comunidades que tenemos a nuestro derredor.
    2. Esto puede involucrar no sólo organizar y efectuar análisis de datos, sino producir representaciones gráficas para su visualización y comprensión efectiva (infografías participativas por ejemplo).
  4. Promover el uso de Shiny.
    1. La producción de documentos impulsados por datos se beneficia de aprender y recurrir al uso de aplicaciones desarrolladas en la plataforma web dinámica shiny.
    2. Esto puede ser particularmente útil para dinamizar las experiencias de aprendizaje en los salones de clase.
  5. Pedagogía de ciencia de datos.
    1. Conviene desarrollar prácticas que activamente examinen y promuevan las mejores prácticas en la enseñanza de enfoques de ciencia de datos (métodos estadísticos y computacionales).
    2. Habríamos de procurar hacer esto en los salones de clase
    3. ¿también deberíamos ofrecer materiales de acceso masivo en clases en línea o tutoriales grabados?

El gobierno mexicano ya opera bajo un marco normativo propicio para los datos abiertos. Es parte de un esfuerzo cívico de transparentar las acciones administrativas (Figura 2). El avance que esto significa también es adecuado para incentivar acciones acordes con un marco de ciencia abierta.

Figura 2: Infografía producida por el gobierno federal mexicano

Para mayor referencia, les sugerimos consultar lo que ofrece el Open data Charter, por ejemplo:

Principos de los datos abiertos

Podríamos considerar respaldar abiertamente el trabajo y marco conceptual que impulsa esa organización. Aquí está lo que piden que hagamos en tal caso:

Respaldar al Open Data Charter

Finalmente, hay que considerar que la gestión de datos frecuentemente nos conduce a la necesidad de desarrollar estrategias algorítmicas de gestión de los datos. Así, algunas veces poco a poco y otras desde un principio, llegamos al ámbito del desarrollo de código. Para esto consideramos importante tener en cuenta el pacto del contribuyente

Un código de conducta para las comunidades de código abierto

La mesa redonda que planeamos con los elementos indicados en esta contribución, se realizó efectivamente en la sede Xalapa del Inecol el 22 de marzo, 2024. Un resumen de las reflexiones que se externaron en la mesa sobre datos abiertos se incluye en nuestro blog.