Entrenar una sola inteligencia artificial puede contaminar tanto como 2.800 vuelos Madrid-Barcelona

Adiestrar una inteligencia artificial requiere una gran cantidad de energía. Según el primer estudio que lo ha analizado en profundidad, publicado por la Universidad de Massachusetts Amherst, la huella de carbono que deja el entrenamiento de una inteligencia artificial con un sistema de aprendizaje automático avanzado es ingente. Similar a la de 2.840 vuelos de Madrid a Barcelona, por ejemplo.

Aunque la industria recurra a este nombre comercial, un sistema de “inteligencia artificial” es en realidad un conjunto de fórmulas matemáticas que interpretan patrones y sacan conclusiones tras analizar miles de datos en una fracción de segundo. Más que “inteligente”, este proceso es en realidad es “algo tonto”, como explicaba a este medio la matemática Cathy O'Neil: no deja de ser una máquina haciendo un cálculo complejo con las operaciones que un humano ha programado previamente. Cuantos más datos pueda utilizar y más refinada sea su programación, más certera será esa inteligencia artificial.

Lo mismo ocurre con los sistemas de aprendizaje automático que pueden incluir la IA. Un método para que un software ya programado mejore por sí solo sin intervención humana es lanzarlo a realizar operaciones que se basan en el ensayo y error. ¿Cuántas? Millones, decenas de millones, cientos de millones. El sistema prueba una solución y registra el resultado que obtiene. Cuantas más pruebas haga, más mejorará, al engordar su base de datos con resultados que le sirven para evaluar cómo de importante es cada variable para el resultado final. Este proceso de entrenamiento puede llegar a durar semanas o meses.

Tanto la consulta y modificación constante de inmensas bases de datos como las operaciones de prueba consumen una gran cantidad de energía. Los científicos sabían que entrenar uno solo de estos sistemas algorítmicos con aprendizaje automático supone un gran coste energético, pero no habían calculado su impacto ambiental. Hasta ahora.

La comparación se establece con el modelo más contaminante que puede utilizarse para entrenar una IA que ha detectado el estudio de la universidad estadounidense. Los científicos lo hacen calculando los kilowatios por hora necesarios para este proceso de adiestramiento, que pueden ser traducidos en una factura eléctrica y en unas emisiones de CO2 asociadas. Así, asignan una huella de carbono de unas 284 toneladas (626.155 libras) al modelo que más contaminación provoca, la misma que deja la producción y toda la vida útil de cinco coches americanos, siguiendo la comparación presente en el estudio.

“Adiestrar un modelo de última generación requiere recursos informáticos sustanciales que demandan una energía considerable, con su coste económico y medioambiental asociado”, señalan los autores, pero denuncian que “investigar y desarrollar nuevos modelos multiplica estos costes cientos de veces al requerir un re-entrenamiento para experimentar con nuevas arquitecturas e hiperparámetros”.

El estudio se centra en la huella de carbono de las IA entrenadas para comprender cómo funciona el lenguaje humano (NLP, por sus siglas en inglés). Ya existen varios modelos en funcionamiento que pueden, por ejemplo, escribir crónicas de partidos de fútbol. Hay que aclarar que la IA no tiene ni idea de lo que está diciendo, pero es capaz de transformar las estadísticas de un partido en lenguaje humano de forma que una persona sí lo entienda. Y ya lo hacen razonablemente bien, como Ana Futbot.

“Aunque hace una década los modelos NLP podían ser entrenados y desarrollados en un portátil personal, muchos ahora requieren múltiples instancias de hardware como GPUs o TPUs [unidades de procesamiento gráfico y unidades de procesamiento tensorial, respectivamente, por sus siglas en inglés]”, recoge el estudio: “Incluso cuando estos caros recursos están disponibles, el entrenamiento de estos modelos incurre en un coste substancial para el medio ambiente, debido a la energía requerida para alimentar este hardware durante semanas o meses cada vez”.

Según sus cálculos, entrenar una de estas IAs mediante sistemas de aprendizaje automático avanzado emite unas 35 toneladas de CO2 a la atmósfera. Tanto como contaminan de media seis personas residentes en la UE en todo un año. Sin embargo, los científicos han encontrado que el principal problema está en las redes neuronales.

Techo medioambiental: lograr una pequeña mejora dispara las emisiones

En su investigación, los científicos hallaron que la huella de carbono asociada al desarrollo de sistemas de inteligencia artificial crecía proporcionalmente a su complejidad hasta alcanzar un punto de inflexión: la adición de un mecanismo conocido como red neuronal [Qué son las redes neuronales y por qué vamos a oír hablar cada vez más sobre ellas]. Una IA sin red neuronal tiene una huella de carbono de unos 650 kilos; con ella, 285 toneladas.

Las redes neuronales producen una mejora en el rendimiento de la IA, a costa de un impacto medioambiental altísimo derivado del gasto que deriva poner a funcionar los super ordenadores que utilizan para sus cálculos. “Estas mejoras en la precisión dependen de la disponibilidad de cuantiosos recursos informáticos que conllevan consumos de energía igual de sustanciales”, detallan.

Entrenar una sola inteligencia artificial puede contaminar tanto como 2.800 vuelos Madrid-Barcelona

La Universidad de Massachusetts Amherst analiza por primera vez la huella de carbono que deja la inteligencia artificial y la energía necesaria para entrenarla

Los resultados muestran que los sistemas de aprendizaje automático y las redes neuronales disparan el impacto medioambiental

Adiestrar una IA con arquitectura neuronal emite 284 toneladas de CO2, equiparable a lo que contaminan 45 europeos en todo un año

Techo medioambiental: lograr una pequeña mejora dispara las emisiones