publicidad

Un sistema computacional facilita la gestión y la distribución de datos climáticos en Brasil

Cooperación comprende el intercambio de conocimiento y de investigadores para el aprendizaje de técnicas y mecanismos de gestión de datos, integración, distribución, modelado y visualización de datos

publicidad

Científicos captan diariamente en la Amazonia brasileña y en otras regiones de Brasil miles de datos sobre las condiciones de la atmósfera, entre ellos los referentes a la concentración de material en partículas y de gases, las propiedades de las nubes y de parámetros meteorológicos tales como la temperatura, la humedad y la velocidad de los vientos. Esta información ayuda a entender el impacto de la contaminación sobre el clima y sobre el ciclo hidrológico, por ejemplo. También permiten estimar de qué manera se verán afectadas por los cambios climáticos ciertas zonas.

Buena parte de los datos generados no se publican y permanecen inaccesibles para la gran mayoría de los científicos. Con el objetivo de modificar este panorama y de contribuir a la mejora del sistema de ciencia y tecnología brasileño, la Universidad de São Paulo (USP), la Universidad Federal de São Paulo (Unifesp) y el Instituto Nacional de Investigaciones Espaciales (Inpe) firmaron un acuerdo con el Oak Ridge National Laboratory, del Departamento de Energía de Estados Unidos. Dicha institución tiene 27 años de experiencia en la gestión de datos ambientales y atmosféricos.

Esta cooperación comprende el intercambio de conocimiento (con datos compartidos y software de código abierto) y de investigadores para el aprendizaje de técnicas y mecanismos de gestión de datos, integración, distribución, modelado y visualización de datos. Este tema fue objeto de debate durante el 5º Workshop on Data Science – Challenges in Brazilian Context to Promote Atmospheric Data Management, realizado en febrero en la Escuela Politécnica (Poli) de la USP.

Dicho acuerdo apunta a apoyar el desarrollo de un sistema y de servicios computacionales para que la gestión y la curaduría de los datos atmosféricos puedan realizarse en las instituciones brasileñas, empezando por la información recabada en el marco de proyectos apoyados por la FAPESP, tales como la campaña científica GoAmazon (Green Ocean Amazon) y el proyecto intitulado El ciclo de vida de los aerosoles y las nubes en la Amazonia, vinculado al Programa FAPESP de Investigaciones sobre Cambios Climáticos Globales (PFPMCG).

“Se estima que más del 80% de los datos atmosféricos recolectados no se publican. Y en general, se los obtiene con recursos públicos. Por ende, son datos públicos. El avance en la gestión de ese conocimiento, en su distribución que lo vuelva accesible para los demás científicos, optimiza el uso de los recursos. Y contribuye a su vez para el avance de la ciencia, pues más científicos y la sociedad en general podrán tener acceso a esa valiosa información”, dijo Paulo Artaxo, investigador del Instituto de Física de la Universidad de São Paulo (IF-USP) y miembro de la coordinación del PFPMCG.

Esta iniciativa tiene a solucionar un cuello de botella importante en la investigación científica en general. En el mundo se recaban más datos que los que se analizan. Sucede que, mientras que la inversión en infraestructura y el avance tecnológico han permitido avanzar en las formas de obtención, aún es necesario mucho tiempo y capital humano para la concreción de análisis basados en big data. Y este es el enfoque del Grupo de Estudios, Investigaciones y Extensión en Big Data de la Poli-USP, organizador del evento.

“La soberanía del país está relacionada con su capacidad de gestionar esos datos, de hacer descubrimientos con base en ellos y de desarrollar una infraestructura brasileña. Es importante generar esa capacidad. Nuestra ciencia atmosférica es sumamente avanzada y es necesario también contar con capacitación e infraestructura para trabajar con grandes volúmenes de datos atmosféricos, que hagan posible la gestión y la curaduría integrada que abarque desde la adquisición, el procesamiento  y la publicación hasta el análisis de las informaciones”, dijo Pedro Luiz Pizzigatti Corrêa, docente del Departamento de Ingeniería de Computación y Sistemas Digitales de la Poli-USP y coordinador del acuerdo.

Según Pizzigatti Corrêa, la formalización del convenio con el laboratorio del Departamento de Energía de Estados Unidos permitirá que científicos brasileños puedan aplicar el conocimiento de otras iniciativas de gestión de datos atmosféricos, aparte de capacitarse para desarrollar una infraestructura adecuada al escenario nacional. “El objetivo es traer esa capacidad a Brasil y generar una infraestructura computacional adecuada a nuestro ambiente de investigación; y al mismo tiempo, formar investigadores capaces de gestionar esa infraestructura”, dijo el investigador.

De acuerdo con Artaxo, en todas las áreas de la ciencia resulta sumamente importante concretar la gestión y la optimización del uso de datos, y este acuerdo constituye un paso importante para facilitar la distribución del conocimiento. “La cantidad de datos ambientales captada actualmente es enorme y las herramientas de visualización y distribución de big data son absolutamente necesarias. Son datos importantes, a veces históricos; pero, debido a su gran volumen, se hace imposible su análisis y su publicación por parte de un solo grupo de investigación o un investigador. Terminan archivados o dejados en el disco rígido de una computadora cualquiera. Pese a ser únicos, probablemente se perderán al cabo de 10 ó 20 años, con información valiosa y financiada por el Estado”, dijo Artaxo, quien también es miembro del Grupo Intergubernamental de Expertos sobre el Cambio Climático (IPCC) de la Organización de las Naciones Unidas (ONU).

La idea es que, con esta colaboración, los datos queden abiertos para su acceso por parte de la población en general, así como ya sucede con plataformas como la del Programa de Cálculo del Desmonte de la Amazonia (Prodes) del Inpe, que traza el historial de los últimos 30 años de los focos de deforestación en la Amazonia.

“El objetivo es integrar. Con la colaboración, será posible congregar datos de distintas naturalezas: de emisión atmosférica, de cambios climáticos, de variables meteorológicas y de deforestación. De este modo, será posible verificar en una única plataforma si en un año de mucha contaminación había muchos focos de incendios, por ejemplo”, dijo Luciana Varanda Rizzo, docente de la Unifesp e integrante del GoAmazon.

Otra ventaja del proyecto consiste en el incentivo a la interdisciplinariedad. “Son muchos datos para poca gente trabajando. Al compartirlos, es posible que investigadores de otras áreas establezcan correlaciones, por ejemplo, y ayuden así a identificar el impacto de la contaminación sobre la población de una determinada especie”, dijo Varanda Rizzo.

En el marco del acuerdo, el Atmospheric Radiation Measurement (ARM) –que es el programa responsable del desarrollo de herramientas computacionales del Oak Ridge National Laboratory– aportará recursos para la gestión, la distribución y la visualización de datos atmosféricos para que científicos de la USP, la Unifesp y el Inpe puedan operar un Centro de Gestión de Datos Atmosféricos, con grandes bancos de datos y sistemas de distribución y de inteligencia artificial para el mejor aprovechamiento de la información recabada.

Desde 2015, la mayor parte de los datos del proyecto GoAmazon se deposita en el ARM. La otra parte se encuentra en el repositorio del Instituto Max Plank, en Alemania. “Durante los últimos cinco años hemos venido trabajando con la USP en la distribución de datos, en estándares de datos abiertos y en la gestión de datos. Y en los próximos tres años trabajaremos apuntando primeramente a compartir conocimiento y a desarrollar algunas herramientas. El acuerdo que estamos concretando hará posible también la movilidad de alumnos para la capacitación”, dijo Giri Prakash, director del Data Center del ARM.

En la actualidad, la gestión de datos de los proyectos de investigación está a cargo de los científicos exclusivamente. “Como hoy en día tenemos una cantidad impresionante de datos recabándose, no todos los investigadores tienen el conocimiento, la infraestructura y el tiempo necesario como para poner a disposición ese material. Por eso se diseñarán herramientas con miras a facilitar el trabajo de esos científicos”, dijo Artaxo.

Desde 2017, la FAPESP exige un Plan de Gestión de datos entre los anexos obligatorios de las propuestas que se le remiten, con especificaciones acerca de cuáles datos se producirán y como se los gestionará, se los compartirá y se los preservará.

Este texto fue originalmente publicado por Agencia FAPESP de acuerdo con la licencia Creative Commons CC-BY-NC-ND . Lea el original aquí.

publicidad
Salir de la versión móvil