Integridad Ecosistémica Costera

un enfoque de ciencia abierta

Miguel Equihua
y
Octavio Pérez Maqueo

Ciudad de México, 29 mayo 2024

¿Cómo sugerimos hacerlo?

Proposiciones causales

  • Los experimentos formales son la regla de oro para resolver una proposición causal.
  • Cuando no es posible hacer experimentos aleatorizados ¿qué podemos hacer?.
  • Una posibilidad son las redes bayesianas que proponemos para este proyecto
  • La revolución causal sin duda es relevante para la investigación observacional.
  • Una red bayesiana es un DAG (directed acyclic graph).

Anatomía de un DAG

  • Una red bayesiana es un modelo generativo.
  • Identifica en forma completa la distribución conjunta tanto de la o las variables respuesta como de las explicativas.
  • El DAG está compuesto de un diagrama causal y de un conjunto de tablas de probabilidad condicional.

Terminología básica de un DAG

  • Nodo : una variable
  • Arista : una relación causal, representada por una flecha
  • Variable Explicativa : Es nuestro predictor causal de interés. Aquí es la representada por X . También se le llama variable independiente.
  • Respuesta : En el DAG es la representada por Y . También se le llama variable dependiente.
  • Ancestros : Nodos que están “aguas arriba” de una variable dada. En este DAG A y C son ancestros de X .
  • Descendientes : Nodos que están “aguas abajo” de una variable en particular. En este DAG Y y B son descendientes de X .

Formas de razonamiento

Reglas de independencia condicional

Un DAG también describe aspectos clave del “flujo de la asociación” a través de la estructura causal.

  • Cuando las variables están conectadas, correlacionan, lo que implica que la información puede fluir entre ellas en cualquier dirección.

  • Hay tres reglas fundamentales sobre como se puede dar esta interconexión, es decir de como se separan o conectan los nodos.

Regla 1 “variable intermedia”

Dos variables, X e Y, son condicionalmente independientes dado A, si sólo hay una ruta unidireccional entre X e Y, cuando A es una variable (podrían ser muchas) intercalada en el camino.

 

Regla 2 “causa común”

 

Si una variable A es una causa común de las variables X e Y, y solo hay una ruta entre X e Y, entonces X e Y son condicionalmente independientes cuando se consideran como condicionantes los datos de A .

Regla 3 “colisionador”

 

Si una variable A es el nodo de colisión entre dos variables X e Y, y solo hay un camino entre X e Y, entonces X e Y son incondicionalmente independientes pero dependen condicionalmente de A así como de cualquier descendiente de A .

Separación-direccional (d-separation)

El flujo de información en una ruta p queda bloqueado por un conjunto de nodos Z si y sólo si:

  1. p contiene una cadena de nodos ABC o una horquilla ABC , de tal manera que el nodo medio B proporciona datos como criterio condicional de observación. Es decir si la ruta es del tipo variable intermedia o causa común, el condicionarlas bloquea.

  2. p contiene un colisionador ABC tal que ni el nodo de colisión B , ni ninguno de sus descendientes, son criterio para condicionar las observaciones. Es decir condicionar sobre un colisionador desbloquea .

Co-construir el DAG de Integridad costera…

Lo haremos con ayuda de un tablero Miro, con la siguiente rutina de integración del tablero:

  1. Los nodos serán notas adhesivas y los arcos conectores que indican la existencia (a veces sólo la sospecha) de interacción causal entre variables.

…Co-construir el DAG de Integridad costera…

  1. Cada Nodo deberá ser representado por una sola Nota adhesiva (“sticky note”). En este papelito conviene definir operacionalmente la variable, especificar la escala de medición y posible patrón de discretización o conjunto de niveles que puede tomar.

…Co-construir el DAG de Integridad costera…

  1. Cada nodo deberá tener una etiqueta vinculada, que especifique el nombre de la variable que lo representará en forma única en la base de datos.. Se recomienda usar nombres cortos, sin marcas diacríticas o símbolos, ni espacios. Como separador usar guión bajo.

  1. La información reunida en Miro será transferida a R y a Netica para su procesamiento formal

Ciencia Abierta y principios FAIR

  • La producción de datos abiertos considera los principios FAIR.
  • Son un conjunto de recomendaciones para la gestión y cuidado de los datos científicos .
  • La sigla FAIR calificar a los datos científicos en virtud de su Findability, Accessibility, Interoperability, and Reuse. Existe el sitio goFAIR que promueve la adopción de estos principios.

 

Calidad de los datos

  • La calidad y apertura práctica de los datos exige mantenerlos en las mejores condiciones posibles, es decir curarlos.
  • Consideramos las recomendaciones que ofrece el Digital Curation Center.
  • Su lema es suficientemente elocuente: ¡Porque la buena investigación necesita buenos datos!.

 

Metadatos



  • Para encontrar los datos que se comparten se requieren metadatos.
  • El Digital Curation Center ofrece recomendaciones por áreas del conocimiento.

 

¿Qué tan abiertos son nuestros datos?



  • De acuerdo con los principio FAIR, los datos pueden estar en distintos niveles de acceso abierto.
  • La escalera de estructuración y acceso que se ilustra da ideas de esto y de los procesos involucrados.

 

Está presentación es de acceso abierto

Fue producida en RStudio con la ayuda de la plataforma Quarto. Nos proponemos integrar el reporte de este proyecto con estas mismas tecnologías. Por lo pronto, pueden acceder a esta presentación en esta liga (también con el QR que sigue):


https://pe-ciencia-abierta.netlify.app/presentaciones/2024-05-29-ciencia-abierta-costas