Los drones controlados por inteligencia artificial superan a los mejores pilotos humanos
Imagine que un robot autónomo entrenado para pilotar se sube a un vehículo de Fórmula 1 y derrota a Max Verstappen, Lewis Hamilton y Fernando Alonso en una serie de carreras uno contra uno y marca el tiempo más rápido del circuito. Esto es, más o menos, lo que ha sucedido en el ámbito de las carreras de drones, en unas pruebas controladas cuyo resultado se publica este miércoles en la revista Nature.
En un trabajo liderado por el prestigioso investigador Davide Scaramuzza, de la Universidad de Zurich, el investigador Elia Kaufmann detalla cómo un sistema de inteligencia artificial (IA), al que han llamado Swift, compitió contra tres campeones humanos, incluidos los campeones mundiales de dos ligas internacionales, y ganó 15 de las 25 carreras. Y no solo eso, tal y como adelantó hace un año la cadena RAI, también logró el tiempo de carrera más rápido registrado en todo el recorrido, con una ventaja de medio segundo sobre el mejor tiempo registrado por un piloto humano.
“¿Recuerdas cuando Deep Blue, de IBM, ganó a Gary Kasparov, o AlphaGo, de Google, aplastó al máximo campeón de Go? Estas competiciones en las que los algoritmos de inteligencia artificial prevalecieron sobre los campeones humanos son hitos clave en la historia de la IA”, explica Scaramuzza a elDiario.es. “Nuestro resultado marca la primera vez que un robot impulsado por IA vence a un campeón humano en un deporte físico real diseñado para y por humanos”.
Carreras uno contra uno
El trabajo ofrece los detalles de una prueba que se llevó a cabo en junio de 2022 y en la que participaron los dos campeones internacionales Alex Vanover y Thomas Bitmatta y el tres veces campeón de Suiza, Marvin Schaepper. Los tres pilotos recibieron una semana de práctica en la pista de carreras, después de lo cual cada uno de ellos compitió contra Swift en múltiples carreras uno contra uno. En este tipo de competiciones, los profesionales manejan vehículos de alta velocidad a través de circuitos tridimensionales y cada piloto ve el entorno desde la perspectiva de su dron a través de vídeo transmitido desde una cámara a bordo.
En anteriores ensayos, los humanos habían tenido una clara desventaja, pues el sistema autónomo contaba con un equipo que captaba el movimiento desde el exterior del circuito, mientras los humanos solo contaban con las imágenes en la pantallita. En este caso, Kaufmann y sus colegas han querido asegurarse de que se igualaban todo lo posible las condiciones, y dispusieron el sistema para que Swift usara solo sus sensores a bordo y su capacidad de computación, utilizando lo que se conoce como “aprendizaje por refuerzo profundo”, que consiste en una simulación en tiempo real a partir de datos recopilados en el mundo físico.
Es la primera vez que un robot impulsado por IA vence a un campeón humano en un deporte físico real diseñado para y por humanos
Porque, como destaca Scaramuzza, a diferencia de lo que sucede en las competiciones de ajedrez o de Go, aquí se trata de competir en un entorno espídico y cambiante. “Swift fue entrenado en simulación durante 50 minutos”, indica. “Esto corresponde a un equivalente de 23 días de horas de vuelo reales sin interrupción (sin dormir) en los que Swift primero aprende a volar desde cero y luego a competir. Y lo hace mediante ensayo y error, cometiendo errores y recompensando acciones que minimicen los errores (accidentes) y maximicen terminar la carrera en un tiempo mínimo”.
Avanzar hacia lo desconocido
“La mayor limitación que se han autoimpuesto es hacerlo todo con un procesador a bordo del vehículo”, explica Julián Estévez, profesor de la Universidad del País Vasco (UPV/EHU) y especialista en robótica que no ha participado en el estudio. En este caso, los drones están entrenados para distinguir una puerta de lo que no lo es, y a efectuar las trayectorias óptimas para pasar a través de una y, si puede, enfocar a la siguiente. Y aunque tiene memorizado el circuito, una de las principales dificultades es corregir la posición y orientación del dron sobre la marcha. “A falta de referencias, un robot cuanto más avanza, menos sabe dónde está exactamente”, destaca Estévez. “Al principio tiene un 98 % de seguridad de que está en el primer punto, pero tras avanzar un poco más y acumular errores de movimiento y sensores, tiene un 85 % de certeza de que está en el segundo punto, y así hasta el infinito”.
A falta de referencias, un robot cuanto más avanza, menos sabe dónde está exactamente
José Luis Blanco Claraco, catedrático en robótica móvil por la Universidad de Almería, recuerda que Scaramuzza y su equipo en Zurich son una referencia mundial en investigación sobre drones y visión con cámaras para movimientos rápidos. Aquí, como los mismos autores reconocen, su dron autónomo cuenta con varias pequeñas ventajas. “Puede sentir con su IMU (sistema inercial) el movimiento a bordo, mientras los humanos no”, enumera. “Y tiene una menor latencia, es decir, todo se computa a bordo, mientras que el humano necesita recibir la señal de vídeo, y que la señal del mando llegue al dron, aunque esto es sólo unos pocos milisegundos”. Además de que ha sido preparado para ese circuito en concreto, lo que, en su opinión, indica que un humano quizá aún seguiría haciéndolo mejor la primera vez en un circuito que nunca haya visto.
“El uso de sensores inerciales en este caso supone una ventaja significativa para los drones”, añade Para Adrián Carrio, doctor en Automática y Robótica y profesor de Inteligencia Artificial y Robótica en la IE University. Por otro lado, además del tiempo de entrenamiento, los drones autónomos empleados en el estudio tienen un tiempo de reacción casi seis veces más pequeño que el de una persona. “Otra de las principales diferencias observadas es que los drones autónomos no tienen miedo a colisionar con otros drones y los ignoran totalmente, lo que les ofrece una ventaja frente al piloto humano, que trata de evitar las colisiones para mantener la integridad del dron”, observa. Es algo similar a lo que ya se había comprobado experimentalmente enfrentando aviones de guerra tripulados con aviones autónomos: el piloto humano quiere mantener la integridad, no sólo de la aeronave sino la suya propia, lo que le lleva a operar el aparato con una menor agresividad.
“Sentir” el movimiento
En cuanto a los detalles técnicos, Blanco destaca el uso de la “localización y modelado simultáneos” (SLAM, por sus siglas en inglés). “Meter todo el procesamiento necesario para la visión estéreo a bordo de un dron de pequeño peso, no es fácil precisamente”, asegura. “Los autores hacen uso de SLAM visual inercial para estimar el movimiento a partir de las imágenes estéreo, fusionándolo con lo que ‘siente’ (aceleraciones y velocidades angulares de la IMU) y tiene un mapa aprendido de dónde están las puertas, que usan para refinar la posición global dentro del escenario y así poder calcular mejor la trayectoria óptima”. Y esta detección de las puertas en las imágenes se hace con redes neuronales convolucionales (CNN), “el estándar de facto desde hace unos años porque son de lejos la mejor técnica de machine learning para interpretar o encontrar objetos en las imágenes”.
“Este resultado es un hito para la robótica, la inteligencia artificial y más allá”, defiende Scaramuzza. “Y puede inspirar el despliegue de soluciones híbridas basadas en el aprendizaje en otros sistemas físicos, como vehículos autónomos, aviones y robots personales, en una amplia gama de aplicaciones”. “El desarrollo de drones autónomos ha generado mucho conocimiento científico con aplicaciones no sólo en drones sino en otro tipo de robots e incluso fuera del ámbito de la robótica, en aplicaciones como la realidad aumentada y la fotogrametría”, reconoce Carrió. “Las principales tienen que ver con tareas de vigilancia o inspección en entornos interiores: inspección industrial, gestión de almacenes, vigilancia en edificios o búsqueda de personas en zonas de acceso poco seguro”.
En los próximos años veremos cómo estos sistemas superan a pilotos humanos en carreras de motos y coches y posteriormente en todos los demás deportes
¿Y qué será lo siguiente? “En los próximos años veremos cómo estos sistemas superan a pilotos humanos en carreras de motos y coches y posteriormente en todos los demás deportes”, asegura el experto. “En el caso de las carreras, está previsto que esta tecnología se emplee a partir del año 2025 para aumentar la seguridad de los vehículos y evitar accidentes durante las carreras automovilísticas”. Es lo mismo que aventura el especialista en robots autónomos Guido de Croon un artículo de análisis que se publica simultáneamente en la revista Nature, en el que apunta que sería interesante probar esta tecnología en un entorno más realista y variado, donde el sistema tendrá que lidiar con perturbaciones externas como el viento o condiciones de luz cambiantes. “Dado que adquieren información sensorial más rápidamente que los pilotos humanos, que dependen de imágenes retardadas”, concluye, “sin duda los drones también vencerán con el tiempo a los humanos en estas difíciles condiciones”.
7