“No soy un robot”: la inteligencia artificial que engañó al Captcha de Google
El Test de Turing se diferencia de un Captcha en los procedimientos. Nunca jamás en el proceso. A fin de cuentas, son pruebas inversas. Mientras que el primero sitúa al humano como un “juez” que haga preguntas para saber si se encuentra ante una máquina o un igual; en la segunda prueba es la inteligencia artificial quien se viste de árbitro. Es Google preguntando “si somos un robot” y obligándonos a verificar nuestra alma humana marcando una casilla.
El Captcha (Completely Automated Public Turing Test to tell Computers and Humans Apart - Test de Turing público completamente automático para diferenciar entre humanos y máquinas) y el Recaptcha (su actualización en el 2007) ya no sirven para separar humanos de ordenadores: a los segundos les han engañado. Los artífices son varios investigadores de la Universidad de Maryland (EEUU) y otros tantos de Vicarious, una empresa de inteligencia artificial propiedad de Jeff Bezos; el todopoderoso fundador de Amazon.
¿Cómo se engaña a una máquina?
Lo han llamado unCAPTCHA y aseguran que acierta en el 85% de los intentos. El sistema, que fue probado 450 veces, es tan solo un 2% menos fiable que la habilidad humana, que se mueve en porcentajes de éxito cercanos al 87%. Nosotros tardamos unos 9 segundos de media en resolver el test; el sistema tarda 5,42 segundos. Y por si se lo están preguntando: alcanzar un 100% de aciertos es imposible. A veces, los caracteres no se leen, están borrosos o las fotografías son ininteligibles.
Para todos esos momentos y también para las personas ciegas, el sistema de Google pone a nuestra disposición una prueba sonora. Voces al azar dicen números al azar que después hay que introducir para confirmar que no somos robots. Es aquí donde se encuentra el fallo de seguridad de este test máquina-humano y donde el RCN (Red Cortical Recursiva), el algoritmo que usa unCAPTCHA, puede operar a gusto. Por cierto que los investigadores avisaron en abril de este año a la empresa de la existencia de la vulnerabilidad. También lo han subido a GitHub.
El sistema se descarga el audio, lo segmenta en varias piezas, se lo canta a varios asistentes de voz en Internet, convierte sus respuestas sonoras a dígitos y después escribe el número de forma autónoma. Los investigadores han utilizado programas como Google Cloud Platform, IBM Speech Recognition, Sphinx, Bing Speech Recognition y Wit-AI para comparar los audios que luego procesará el RCN, construido a partir de redes neuronales. El algoritmo es capaz de identificar textos en fotografías, identificar números escritos a mano e incluso Captchas que no se había encontrado antes de la fase de entrenamiento.
Si las respuestas que obtiene unCAPTCHA son homófonas, acierta el número sin mucho esfuerzo. En cambio, si lo que escucha le suena parecido pero no igual que un número, entonces adivina cómo suena ese número. “Si suena como un dígito, por ejemplo, 'true' [pronunciado /truː/] suena como 'two' [pronunciado /tuː/], entonces unCAPTCHA adivina su sonido”, explican los investigadores en su web. Lo hace por mera intuición, casi como lo haría un humano.
“Un Captcha se considera roto si puede ser resuelto automáticamente con un porcentaje superior al 1%. El RCN ha sido efectivo frustrando una amplia variedad de Captchas basados en texto con muy poco entrenamiento. [...] Ha sido capaz de resolver Recaptchas con una precisión del 66,8 por ciento (con un acierto por caracter del 94,3%)”, explican los investigadores en su paper oficial.
Spambots: a raya desde los 2000
Spambots“En el futuro exploraremos la eficacia de nuestra metodología de ataque sobre otros sistemas Captcha, incluyendo el de Amazon, el de eBay y más”, avisan los científicos, que auguran que los humanos necesitaremos nuevos métodos en el futuro para distinguir a los spambots.
Gracias al Captcha hemos conseguido mantenerlos a raya hasta ahora. Se inventaron en 1998 aunque estaban patentados desde 1997 y a principios de los 2000 era común encontrarlos a la hora de entrar a leer el correo o de publicar un comentario en un foro. El sistema, sin embargo, fue perdiendo fuelle a medida que la gente en Internet desarrollaba nuevos bots capaces de burlar el test.
Frente a esto, las palabras se hicieron cada vez más complejas y menos visibles. Por eso, para no dejar ciego al personal y, de paso, implementar una capa nueva de seguridad, en el 2007 llegaron los Recaptcha, que añadieron una segunda palabra tachada, emborronada o proveniente directamente de un diccionario. En septiembre del 2009, Google compró la tecnología y la utilizó para digitalizar sus libros de Google Books. The New York Times hizo lo propio con todos sus ejemplares.
Un año más tarde, la tecnología Recaptcha había conseguido descifrar y transcribir 440 millones de palabras, unos 17.600 libros, con una precisión del 99%. Para rizar más el rizo, en 2014, Google consiguió desarrollar un algoritmo que solucionaba sus propios Captchas con una precisión del 99,8%. Lo implantó en Google Maps y, a su vez, lo cruzó con imágenes de su GPS. Luego lo probó con su algoritmo, que resolvió el 90% de los textos y el 96% de números.
Y así llegamos hasta el sistema que Google utiliza actualmente: No Captcha Recaptcha. La multinacional monitoriza los patrones de tu ratón y tu forma de interactuar con la web para determinar si eres un humano o un robot. Es por eso que ya no hay que encontrar una naranja entre 9 fotos o adivinar dónde se encuentra la casa azul entre un mar de casas rojas. Tan solo te pide que seas sincero. El problema viene cuando eres una máquina.