Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

El modelo de análisis climático “made in Cantabria” que se ha colado en Europa

Los investigadores Javier Díez (IFCA) y Mario Santa Cruz (Predictia), dos de los responsables del desarrollo del modelo de inteligencia artificial ConvSwin2SR.

Irene Sainz Oria

Santander —

0

Mario Santa Cruz tiene 25 años, es matemático, estudió un año en Estados Unidos, hizo un máster en Londres y desde hace tres trabaja en Predictia, una empresa cántabra donde realizó prácticas y completó su TFG, relacionado con la aplicación de la inteligencia artificial en la teledetección -utilización de imágenes por satélite para definir usos del suelo- y la meteorología. 

Santa Cruz es uno de los investigadores que ha participado en el desarrollo de la IA ConvSwin2SR, una 'red neuronal' que a través del aprendizaje profundo de más de 12 millones de parámetros es capaz de presentar, en alta resolución y en pocos segundos, datos climáticos de un día en la Península Ibérica. El matemático recibe a elDiario.es en la sede de Predictia en Santander, dispuesto a abordar de forma solemne la tarea de explicar en qué consiste este nuevo modelo. La primera pregunta, que pretendía arrancar un chascarrillo, cae en agua.

¿Esta IA tiene algún mote de andar por casa? ¿Un nombre más amable, como Dall-e, por ejemplo?

No, está pensado para que se entienda en artículos científicos pero nos reservamos la posibilidad para próximas versiones.

El modelo “no sirve para mejorar las previsiones del tiempo como tal”, destacan en una nota de prensa. ¿Por qué especifican este aspecto?

El matiz importante es que nosotros hemos trabajado con reanálisis meteorológico. Utilizamos los datos de ERA5 (desarrollado por el Servicio de Cambio Climático de Copernicus en el Centro Europeo de Meteorología), que analiza el clima planetario desde 1940 hasta nuestros días. Es decir, presenta reconstrucciones de cómo ha sido el estado atmosférico y está entrenado con ese tipo de datos. En ese sentido, es seguro utilizarlo solo en ese contexto.

No obstante, apuntan a que puede tener usos en ámbitos como la agricultura, la energía, recursos hídricos, gestión de desastres, salud pública o cambio climático. ¿En qué sentido?

Sí, claro, eso está relacionado con el hecho de aumentar la resolución. ERA5 proporciona estimaciones horarias de un gran número de variables climáticas, pero su resolución es demasiado baja (cuadros de unos 25 kilómetros de lado) como para aplicarla a zonas concretas, como una calle o un barrio. A través de los datos que aporta CERRA -un reanálisis a mayor resolución pero limitado al área europea y del que sólo hay datos hasta junio de 2021- y el aprendizaje profundo, el modelo que hemos desarrollado ofrece datos casi en directo, no predicciones pero sí la situación de los últimos días.

El objetivo es que la IA sea capaz no solo de memorizar información sino de analizar las relaciones entre los datos

Mario Santa Cruz Responsable del desarrollo del modelo ConvSwin2SR

Los modelos de predicción también se basan en datos reales. ¿Podría utilizarse en el futuro también para eso?

Sería necesario validarlo para estar seguros de que no tiene sesgos particulares en situaciones de eventos extremos, por ejemplo. Por poder, se puede utilizar, pero no es recomendable porque no se ha evaluado en ese contexto.

 ¿A qué se refiere cuando habla de “sesgos”?

Bueno, un sesgo es que el modelo tienda a reproducir una situación porque la ha visto en los datos pero no sea capaz de encontrar la relación que tiene con el clima o con la situación meteorológica. Estos modelos son difíciles de interpretar. El objetivo es mejorar la capacidad de generación, es decir, que sean capaces de aprender las relaciones entre los datos y no de memorizarlos sin más. El problema es que este tipo de inteligencia artificial se alimenta con tanta información que a veces lo que hace es solo memorizar y para unos datos de entrada, te pasan otros de salida muy parecidos simplemente porque es lo que han visto durante el aprendizaje. Es como si en el colegio aprendes que 2+2 son 4 pero no sabes sumar, sino que simplemente lo has memorizado por repetición. En este sentido, nosotros hemos hecho esa evaluación en los datos de reanálisis pero no en escenarios de predicción. En cualquier caso, en el reanálisis no solo se utilizan datos observados sino también modelos físicos, que es la aproximación clásica para predecir el tiempo a través de algoritmos. 

De vuelta a su posible aplicación, ¿podría poner un ejemplo práctico de su uso?

En este modelo se ha pasado de la resolución del ERA5 -un cuadro de 25 kilómetros de lado o 625 kilómetros cuadrados- a un cuadro de 5 kilómetros de lado. En un evento extremo de lluvia vamos a ver una evaluación de impactos mucho más local que serviría para mejorar la planificación urbanística. El Ayuntamiento de cualquier ciudad puede ver cómo esa tormenta ha incidido en áreas concretas y adaptar el diseño del alcantarillado, por ejemplo. Otro claro ejemplo de empresas que pueden encontrar una aplicación práctica son las aseguradoras. De hecho, los datos de reanálisis son la fuente más fiable y más importante utilizada en este ámbito.

¿Cómo detectan que existe esta necesidad? ¿Por qué deciden implementar este modelo?

Tenemos mucha experiencia en el sector del clima y meteorología y sabíamos de la necesidad de un análisis de alta resolución porque el único que hay a nivel europeo llega hasta 2021 y no se actualiza porque tiene un alto costo computacional.

 ¿Y ahí es donde entra el apoyo del Instituto de Física de Cantabria?

Los datos climáticos de ERA5 y CERRA provienen del Centro Europeo de Meteorología, son globales y gratuitos. Además de contar con la colaboración del investigador del IFCA Javier Díaz, hemos trabajado dentro del proyecto europeo AI4EOSC, una plataforma para el desarrollo de modelos y aplicaciones de Inteligencia Artificial (IA), Aprendizaje Automático (ML) y Aprendizaje Profundo (DL) para la Nube Europea de Ciencia Abierta (EOSC por sus siglas en inglés).

El modelo, que está a disposición de los usuarios en la plataforma Hugging face, está entrenado para la variable temperatura en el Mediterráneo. ¿Por qué han elegido esta área geográfica para la primera prueba?

Hemos desarrollado el proyecto como parte del programa Code For Earth del Centro Europeo de Meteorología (ECMWF) y nuestra tarea era aplicar estas tecnologías punteras al ámbito de la meteorología. Empezamos con toda Europa, pero era muy exigente así que nos limitamos a una zona que contuviera todos los retos geográficos: la costa mediterránea, las Islas Baleares, los Pirineos y la cordillera Cantábrica. Tenemos montaña, mar y costa.  

¿Cuánto tiempo puede llevar adaptar el sistema a otra zona y otra variable meteorológica?

La última fase de aprendizaje puede llevar un par de días, pero antes hay un proceso iterativo donde entrenas y validas. Nosotros hemos tardado unos seis meses. Es cierto que la temperatura es una variable muy estable, pero para la precipitación, por ejemplo, sería necesario tocar algo más porque no tendría sentido que la IA encuentre un punto en el mapa donde sea menor que cero.   

¿Cómo empresa, qué monetización tiene este proyecto?

Estamos trabajando ahora en un modelo que se pueda ejecutar en un dominio variable, más grande, y esto lo aplicaremos de manera interna a otros productos que ofrecemos a las empresas.

¿Qué opinión tiene sobre el debate en torno al desarrollo de las IA en general?

En la actualidad las IA están lejos de tomar conciencia. En este momento es difícil evaluar hasta qué punto están aprendiendo relaciones o solo memorizando datos. Hay muchos debates que tienen que ser evaluados a fondo. No sabemos muy bien cómo funcionan aún. Es cierto que si los datos con los que las alimentan tienen un sesgo machista o racista, la IA puede ser racista o machista, pero no es tan fácil definirla así. En principio, estas redes neuronales replican la manera en la que los humanos aprendemos: cuando un alumno hace un examen, establece unas predicciones y el examinador califica las respuestas, las predicciones. Donde la IA haya puesto una temperatura cercana a la real, se le pone una nota alta, por seguir con el mismo ejemplo, y donde se haya equivocado, una baja. Su objetivo es sacar un diez y así va cambiando las respuestas erróneas sin modificar el resto. Es como explicarle a un niño qué es un gato o qué es un perro o enseñarle muchas fotos de gatos y perros y que él aprenda las diferencias. 

Etiquetas
stats