Los robots que riman en euskera para mostrar cómo aprenden las máquinas

Los versolaris o bertsolari son improvisadores que cantan versos (bertsos) en euskeraversolarisbertsolaribertsos, siguiendo una melodía y una rima e inventando las frases de acuerdo a un tema prefijado. Se trata de verdaderos artistas de la cultura y la tradición vascas que viven un renacimiento desde comienzos del siglo pasado y que, como sus predecesores más antiguos, continúan demostrando su ingenio y el potencial de su voz en actos y festejos.

Campeonatos y bertso eskolas fomentan entre los más jóvenes esta forma de literatura oral cuya calidad, más allá de la rima y la métrica, se mide en función de su contenido y su valor poético. Dos aspectos en los que ponen especial cuidado los versolaris entrenados por investigadores del grupo de Robótica y Sistemas Autónomos de la Universidad del País Vasco (UPV). No pueden presumir de tener una voz angelical, pero sí de ser los únicos robots en dedicarse a este arte popular.

“El objetivo del proyecto BertsoBot proyecto BertsoBotes mostrar de una forma amena al público general los avances en campos como la visión por ordenador, el aprendizaje automático y el procesamiento del lenguaje natural”, explica a HojaDeRouter.com Basilio Sierra, líder del grupo. Sierra y algunos colegas han publicado recientemente dos métodos para clasificar música de bertsos y generar nuevas melodías, un estudio que compone otra pieza del puzle tecnológico que les permite “poner a los robots a cantar versos”.

Pero no solo recitan: las máquinas son capaces de levantarse de la silla sobre el escenario cuando les toca, acercarse al micrófono sin rebasarlo, reconocer a la persona que le propone el tema, entender qué le piden y entonar frases con sentido y que rimen.

Los versos de un robot

Los bertsos en euskera no son como los versos en castellano, sino que coinciden con la definición de estrofa. Según Sierra, pueden emplearse diferentes métodos para conseguir que los robots inventen este tipo de composiciones. La más sencilla (y la más utilizada) consiste en “coger versos [frases] de distintos versolaris profesionales que rimen y, con un algoritmo, buscar aquellas rimas que, aunque pertenezcan a distintas estrofas o bertsos, son coherentes con el tema”bertsos, señala el investigador.

Así lo hacen los profesionales: improvisan en función del tema que se les propone sobre el escenario. Los robots utilizan algoritmos de procesamiento del lenguaje natural para captar el significado del mensaje. A partir de él, rastrean una extensa base de datos de textos en euskera para seleccionar las frases con una semántica más parecida y coherentes con el tema. Según Sierra, el proceso es muy similar al que realiza Google para devolverte los resultados de una búsqueda por palabras clave.

Además, “tenemos un verificador de rimas que selecciona varias frases dentro de un subconjunto”, dice el ingeniero de la UPV. Entonces, si la máquina debe componer una estrofa con cuatro versos, busca decenas de frases sobre el tema especificado y, entre ellas, selecciona las cuatro que mejor riman entre sí. “También tenemos un sistema que elabora la música a partir de ese texto que genera el robot”, añade Sierra.

Durante todo este proceso, los versolaris robóticos (suelen ser dos sobre el escenario) están conectados entre sí y a una especie de cerebro remoto a través de internet. “El procesamiento del lenguaje natural requiere una gran potencia de cálculo que no se realiza en el robot, sino en un potente ordenador situado a distancia. Por eso necesitan conexión a la Red”, advierte Sierra.

Como los versolaris de carne y hueso, los de silicio cantan sus obras líricas gracias a un sintetizador de voz desarrollado por otro grupo de investigación de la UPV (AhoLab). “Dependiendo del tipo de verso, seleccionamos la música a partir de un conjunto de melodías que se utilizan en los bertsos y el texto es transmitido al sintetizador de voz que lo emite en forma de canción”, describe el líder del proyecto BertsoBot.

Visión artificial para orientarse como los humanos

Pero antes de cantar, el robot se levanta de la silla y reconoce tanto el micrófono como a la persona o el robot que le propone los temas. Sus ojos artificiales son en realidad cámaras estándares de tipo RGB-D y otras encargadas de proporcionar información sobre la distancia a la que se encuentran los objetos, que identifica gracias al machine learning.

“Encaminan sus pasos hacia el micrófono y, cuando ya están suficientemente cerca, se paran y esperan a que les digan el tema”, explica Sierra. Mientras les hablan, miran a la cara de su interlocutor —ya sea un humano u otro robot—. “Las técnicas de reconocimiento facial les permiten identificar a la persona que se dirige a ellos o a la que se están dirigiendo” sobre el escenario. Después de cantar, las máquinas vuelven, diligentes, a su asiento.

“Estamos trabajando para que la interacción sea cada vez más natural”, señala el investigador. Lo hacen a través de otros proyectos, cuyos avances luego aplican para mejorar las habilidades de los BertsoBots. Actualmente, colaboran con la Universidad de Palermo para desarrollar diálogos cada vez más humanos, enseñando a las máquinas a expresar emociones de acuerdo al sentido de sus palabras. “El robot puede hablar de forma positiva, más triste o neutral, y gesticula según lo que quiere transmitir”, indica Sierra.

Las máquinas entienden las emociones en un texto a través de lo que se conoce como sentiment analisis o análisis del sentimientosentiment analisis, una aplicación del procesamiento del lenguaje natural basada en la detección de patrones en los textos que indican su sentido positivo o negativo. Es la misma técnica que se emplea, por ejemplo, para estudiar las reacciones ante algún evento en Twitter. 

Una vez añadan estas nuevas capacidades a los robots versolaris, estos podrán acompañar sus simpáticos cantos con movimientos que denoten alegría, enfado o tristeza en próximas exhibiciones. Desde que el proyecto arrancó, allá por el 2010, sus responsables han organizado diferentes actosdiferentes actos, principalmente en el ámbito universitario, donde las máquinas han estado acompañadas por improvisadores profesionales de carne y hueso.

“Hacemos muy pocos, porque prepararlos nos lleva mucho tiempo”, asegura Sierra. Es necesario diseñar al detalle cada actuación, comprobar que el sitio es el adecuado y aplicar todos los nuevos avances que el investigador y su equipo han conseguido en el tiempo transcurrido desde la anterior. Emplean, principalmente, dos tipos de robots humanoides: Pepper y NAO, de apariencia similar, aunque un poco más pequeño que el primero. Dos máquinas convertidas en verdaderos emisarios de la cultura popular vasca gracias a la inteligencia artificial.

  --------------------------------------------------

Las imágenes de este reportaje son cortesía de la Universidad del País Vasco