Una nueva inteligencia artificial ha causado furor en redes la última semana. Se trata de aplicaciones capaces de alterar un vídeo que muestre a una persona hablando en su idioma para que parezca que lo hace en otra lengua. La tecnología copia su timbre de voz y el tono que emplea al expresarse, pero los traduce automáticamente para que parezca que tiene un dominio completo de la lengua de destino. A su vez, altera el movimiento de sus labios para que encaje con la nueva pronunciación.
Se trata de otra de los aplicaciones de la IA con insondable potencial. Sin embargo, su popularidad en España ha tenido un marcado carácter nacional: ha explotado por las bromas. Todo empezó cuando el conocido tuitero @norcoreano subió un clip que mostraba a Belén Esteban hablando en un perfecto inglés junto a David Broncano.
Sus seguidores le preguntaron qué herramienta había utilizado para crearlo. Veinte minutos después, uno de ellos respondió con otro vídeo del Fary explicando su teoría del “hombre blandengue” en perfecto inglés. Entonces todo estalló.
En cuestión de horas cientos de vídeos de históricos memes, desde la “droga en el colacao” a la socorrista que “la lía parda”, aparecieron doblados en múltiples idiomas. Luego fueron los chistes de Chiquito de la Calzada, las escenas de Aquí no hay quien viva, los capítulos de Hermano mayor. Entre broma y broma afloró incluso el potencial más peligroso de esta herramienta a través de un vídeo de Alberto Núñez Feijóo hablando en inglés, que una reconocida periodista alabó por su “perfecta dicción” sin darse cuenta de que también estaba manipulado.
La tromba de españoles que se registró en la plataforma de la startup que desarrolla una de estas herramientas de doblaje automático llegó a tumbar sus servidores. La empresa, llamada Rask.ai y radicada en Denver, tuvo que poner barreras para contenerlos. “Lo de España ha sido una auténtica avalancha”, ha confesado su directora a El Confidencial: “Hemos tenido que fortalecer nuestro muro de pago porque la cantidad de usuarios era enorme, y nosotros ya teníamos unos usuarios previos que necesitaban procesar sus vídeos”.
Uno de esos usuarios que se encontró la web caída era el director y guionista Luis Endera. “Entró todo el mundo a hacer chorradas y, cuando me metí yo a hacer mis cosas, me salió un mensaje de que la web estaba saturada y dije '¡Me cago en la leche!'”, cuenta entre risas.
Desde mayo
Cuando @norcoreano colgó el primer meme de Belén Esteban y X (antes conocida como Twitter), empezó a alucinar con la capacidad de la IA para simular el tono y el timbre de la voz de las personas que doblaba, Endera colgó uno de los clips del corto que está doblando con Rask.ai. “Hay cositas por ajustar, pero el resultado es espectacular”, destacó.
Entre los miles de comentarios con clips de bromas, el suyo pasó desapercibido. Sin embargo, es el que de verdad muestra el potencial de esta tecnología para revolucionar el sector audiovisual. Desde las grandes producciones al cine independiente, llegando incluso hasta los vídeos de YouTube o TikTok, cuyos usuarios ahora pueden aspirar a tener un alcance verdaderamente global.
“Es verdad que mucha gente ya está acostumbrada a ver las películas o cortos con subtítulos, pero yo creo que llegado el momento en el que la tecnología se acerca tanto al original, no hay nada mejor que verlo en tu idioma”, opina Endera en conversación con elDiario.es.
El director revela que ha estado trabajando con la herramienta de Rask.ai desde mayo, cuando mantuvo una reunión con sus desarrolladores. Ha empezado con el corto “Los Niños del Túnel” y avanza que continuará con Pyramiden, su último largometraje: “La gente lo ha conocido ahora por los vídeos de memes, pero la herramienta lleva ya varios meses en el mercado y la empresa, como un año”.
Puedo doblar mi película al japonés por 300 o 400 euros. Eso es algo que ahora mismo solo pueden hacer las grandes productoras
Llegó a ellos buscando cómo internacionalizar Pyramiden. “Yo estaba pensando siempre en la película. Poder distribuirla en otros mercados, y así será mucho más sencillo. Si yo contacto con alguna plataforma en Japón, por decir un país, con esta herramienta puedo doblar mi película al japonés por 300 o 400 euros. Eso es algo que ahora mismo solo pueden hacer las grandes productoras”, expone.
Según sus cálculos, ese es el rango de precios en el que se mueve traducir una película completa con Rask.ai: “El precio es por minuto, pero varía en función de si hay una o más personas hablando y claro, cuánto tiempo hablen”. Adelanta que puede ser unas 20 veces menos que lo que cuesta doblar un largometraje de bajo coste con actores de doblaje, sin contratar a directores o los profesionales más reconocidos de este campo.
Lo que importa es que el resultado sea tan bueno que la gente lo acepte. Y yo estoy convencido de que sí
“Pero ya no es solo el coste, que por ejemplo a las grandes productoras es algo que no les va a importar tanto. Lo que importa es que el resultado sea tan bueno que la gente lo acepte. Y yo estoy convencido de que sí. En un tiempo no hay duda de que lo va a ser. Las productoras de Hollywood tendrán un departamento que se dedique a ajustar el doblaje automático, porque el resultado es bastante potente. Yo las primeras pruebas que hice fueron en mayo y ya se ha notado la mejora”, detalla.
“Esperamos que el público no se conforme con el automatismo”
Esta revolución impacta de lleno a los actores de doblaje. elDiario.es habló con varios de ellos en este reportaje, en el que explicaron que han empezado a organizarse internacionalmente para defender sus trabajos ante lo que se les viene encima. Sus reclamaciones giran en torno a dos puntos. El primero, que no se engañe al público sobre el origen artificial de una voz. El segundo, que no se impida que sus voces se usen para entrenar a la IA sin su consentimiento.
Adoma, el sindicato de actores de doblaje de Madrid, emitió un comunicado cuando se viralizaron los vídeos de los memes doblados por IA. “Entendemos el revuelo que están causando estos vídeos”, manifestaron, “pero creemos que el error de base está en llamar a eso 'doblaje'. Ese contenido es más bien una traducción simultánea automática, hecha con una tecnología nueva y cada vez más perfeccionada que permite efectos vistosos”.
El doblaje es un complejo proceso artístico, que implica a profesionales de la traducción, la adaptación y la dirección. Simplemente son dos mundos distintos
“El doblaje es un complejo proceso artístico, que implica a profesionales de la traducción, la adaptación y la dirección, para que finalmente un actor vuelva a crear desde sí mismo, y desde el máximo respeto a la interpretación original, el trabajo que en su día hizo un compañero en otro idioma. Simplemente son dos mundos distintos”, argumentan.
“Solo esperamos que el público no se conforme con el automatismo y siga exigiendo un doblaje de verdad, el que es cultura de cada país y de cada lengua, y el que lleva emocionándonos a todos desde que tenemos memoria”, concluían.
No es magia
Endera recalca en su conversación con este medio que por el momento estas herramientas no son totalmente automáticas. No se carga la película y se dobla sola mientras se hace el café. “Para un vídeo de una persona hablando 20 segundos, como los vídeos que han salido estos días, no es problema si se desincroniza un poco, pero en una película no puede pasar. Cuando hay varias personas hablando, con alguna de ellas que no sale en plano, se complica un poco”, apunta.
El director detalla que la herramienta manda dos guiones al operador, cada uno en un idioma: “Ahí tú tienes que vigilar que los tiempos coincidan, porque si una frase va a quedar más larga en español que en inglés, hay que cuadrarlo. Al final tiene un trabajo detrás. Al final yo me he dado cuenta de que lo mejor es traducir cada voz de la película de manera independiente. Saco la voz de uno, la sincronizo y luego saco la voz de otro actor”.
Endera calcula que una película completa como la suya le costaría un par de semanas completas de trabajo: “Tiene sus cosillas y debe mejorar mucho todavía, pero para mi gusto el resultado es muy bueno”.