Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Olvídate del test de Turing

"Turing Test", una instalación del 24/Seven Project Space en Gooden Gallery, Londres (2011)

Marta Peirano

El Test de Turing que propuso Alan Turing en 1950 estaba basado en un popular programa de televisión en el que un hombre y una mujer escondidos en cuartos separados contestaban las preguntas del público, que debe descubrir cuál es cuál. Esta vintagera batalla de los sexos se llamaba el Juego de imitación (que por cierto da nombre a la espantosa película sobre el genial matemático). Los concursantes debían escribir sus respuestas a máquina, para impedir que su voz o su letra revelara su identidad.

La idea era hacerse pasar por el otro, tratando de contestar como lo haría un hombre si eras la chica, y como lo haría una mujer si eras el varón. La propuesta de Turing era sustituir a uno de ellos por una máquina, y dejar que el público adivinara cuál de los dos era humano. Si la máquina era capaz de imitar a su contrincante hasta el punto de engañar a los demás -si parece leche, huele a leche y sabe a leche- entonces podíamos hablar de inteligencia. Porque ¿cómo distinguir la apariencia de inteligencia de la inteligencia misma?

Hoy el test de Turing está más que superado; el nuevo problema, como asegura jocosamente Evgeny Morozov, es encontrar humanos capaz de imitar la inteligencia de una máquina. La cosa nos preocupa lo bastante como para haberle dedicado una ola de películas cada vez más alejadas de la ciencia ficción. El protagonista de Her sabe que su sistema operativo es un sistema operativo pero eso no le impide enamorarse de “ella”. El de Ex-Machina sabe que su andreida está diseñada para enamorar al sujeto para que le ayude a escapar de su jaula de oro.

No les vale para nada. Uno sabe que su enamorada es una es un conjunto de compiladores, bases de datos y programas que se ejecutan siguiendo instrucciones específicas diseñadas a propósito y el otro sabe que su novia es un transistor de silicio con pechos de polypiel. Y les da exactamente igual. Lo que les importa es otra cosa mucho más importante: ¿son estas nereidas gente de fiar? ¿O son demasiado inteligentes para dedicar su vida a un ser humano?

¿Sueñan los robots con manchas de tinta?

El problema es que los humanos somos los peores jueces del test de Turing. Nos venden las expectativas: queremos que las máquinas sean sensibles e inteligentes porque así podemos programarlas para querernos siempre y acabar con una vida de aterradora contingencia emocional sin la vergüenza de convivir con una madeja de cables. Pero, bajo el optimismo, sospechamos que en cuanto esas mismas máquinas sean tan sofisticadas como para querer y ser queridas, se producirá la chispa del libre albedrío y se largarán para quererse entre ellas, que es lo que haría cualquier máquina inteligente en su sano juicio. Tampoco podemos dejar que alguien mejor preparado -esto es, otra Inteligencia Artificial- juzgue su nivel de consciencia sin entrar en una espiral hilarante de surrealismo carroliano, como nos recuerda este vídeo de dos chatbots hablando entre ellos.

Por esto y por otros motivos, hay ingenieros que consideran que el Test no sólo está obsoleto sino que es inapropiado para medir el grado de consciencia de una máquina, porque su capacidad de engañarnos dice más de nuestra inteligencia que de la suya. El nuevo estándar para los concursos de inteligencia artificial están menos centrados en su capacidad para imitarnos y más en su habilidad para inferir conclusiones correctas, algo que nosotros desarrollamos gracias a una mezcla de inteligencia, experiencia y sentido común.

Esto incluye resolver frases ambiguas, como saber que en “El trofeo no cabe en el sombrero porque es demasiado grande”, lo grande es el trofeo; pero también inferir un contexto, como que una taza humeante medio vacía implica que alguien está bebiendo café en la habitación, aunque no esté presente. Y, gracias a la ocurrencia de dos ingenieros de Google, responsables del equipo de visualización de datos Big Picture, también lo que hay en su imaginación.

La capacidad de sacar conclusiones precipitadas y aferrarnos a ellas es fundamentalmente humana (Malcolm Gladwell le dedica su primer bestseller, Blink). Y a menudo se usa como herramienta para desenterrar los fantasmas de la psique. Una de las fórmulas más conocidas es el Test de Rorschach, un “método proyectivo de psicodiagnóstico” presentado por el psicoanalista suizo Hermann Rorschach en 1921. El test original consiste en una serie de 10 láminas con manchas de tinta de carácter simétrico pero no figurativo. El sujeto debe decir lo que ve en cada mancha y se espera que vea cosas específicas, como quien ve ovejas en las nubes o el futuro en los posos del té. La idea es que la naturaleza de las visiones (que se llaman, por cierto, pareidolia) deben reflejar el carácter del sujeto en cuestión y el contenido de su psique y así ayudar al terapeuta a ponerle en orden por dentro. Aplicado a una máquina, y sabiendo con exactitud lo que tiene por dentro, el test se transforma en otra cosa.

“¿No podría ser que las máquinas tengan también sentimientos, personalidades y hasta idiosincracias psicológicas?”, se preguntaban Fernanda Viégas y Martin Wattenberg en un post titulado Move on, Turing (Deja sitio, Turing). -¿No pueden tener su propia inteligencia idiosincrática, distinta de la humana?“. Y, sin esperar respuesta, han sometido a cuatro sujetos a su propio Rorschach para ”comprender los pensamientos subconscientes de sus nuevos cerebros mecánicos“.

Algunos robots rebeldes

Naturalmente, su primera preocupación era que los cuatro sujetos vieran lo mismo. No fue así. En la primera lámina, Robot 1 responde de manera “práctica y comprensible”, pero es inseguro. No quiere equivocarse y ofrece dos respuestas en lugar de una. Es cobarde. Robot 2 dice “horquilla”, lo que es “una sorpresa, hasta que piensas en las horquillas con forma de mariposa”. Ahí todo bien. Robot 3 dice que es arte, lo cual es perfectamente lógico. Pero Robot 4 les desbanca de inmediato diciendo lo que realmente es: un test de Rorschach. Esquiva eso.

Las respuestas subsiguientes confirman la evaluación inicial. R1 es dubitativo, R2 es poético, R3 es categórico y R4 dice alternativamente que la mancha es un test de Rorschach o una mancha de tinta en un papel. Y, como la concursante rebelde de unReal, el falso documental sobre el reality The Bachelor, parece estar diciendo “y pienso repetirlo y repetirlo hasta que dejes de grabar”.

Está por ver si ha nacido una estrella o si le darán su propio programa de televisión. De momento, el experimento es interesante, pero sólo como herramienta para recondicionar nuestros prejuicios, que era el objetivo último del texto original de Turing. Una vez más, las conclusiones de sus artífices dice mucho más de los ingenieros y nada de las máquinas, que ellos han convertido sin quererlo en sus propias manchas de Rorschach. Si no, contemos los estereotipos:

Cuando empezamos a subir las imágenes, los cuatro sistemas de reconocimiento de imagen nos parecían indistinguibles unos de otros: demos de HTML molón con diseño vanguardista de Silicon Valley -terminan los ingenieros.- Después, dejamos de verlos como demos tecnológicos y más como el chico de la primera fila que trata de llamar la atención de su profesora, el amigo ingenioso que siempre dice algo gracioso, el silencioso atormentado con el alma de un artista ... y el cínico.

Etiquetas
stats