Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Una Inteligencia Artificial crea imágenes de comidas tan solo leyendo la receta

Macarrones con tomate

David Sarabia

No tiene ojos, nariz ni boca. Tampoco tiene manos para coger un cuchillo ni fuerza para sostener un plato, pero la Inteligencia Artificial (IA) desarrollada por tres investigadores de la Universidad de Tel-Aviv (Israel) cocina. No lo hace como un concursante de Masterchef ni como lo haría tu abuela en casa; más bien GILT, el acrónimo que da nombre al estudio (Generating Images from Long Text - Creando imágenes a partir de textos largos), lee una receta y después la plasma en una fotografía.

Parece raro pero es así: los tres autores del estudio, Ori Bar El, Ori Licht y Netanel Yosephian han subido el trabajo a arxiv.org, un repositorio de artículos científicos propiedad de la Universidad de Cornell (Nueva York, EEUU). Allí explican cómo han entrenado a la IA, que primero tuvo que leerse cerca de 52.000 recetas de cocina, con sus correspondientes fotografías de cada plato.

“Nuestro sistema coge como input una receta y genera, desde cero, una imagen que refleja los alimentos que el sistema 'cree' que esa receta describe”, explica a Digital Trends Ori Bar El, director del estudio. La IA no sabe nunca de qué receta se trata ya que no conoce el título de lo que está viendo. Tampoco puede inferir ni adivinar cómo es la fotografía del plato terminado al no incluir las instrucciones ninguna referencia a ella.

A estudiar más de 52.000 recetas

El proceso mediante el que la IA convierte la receta a fotografía es un tanto complicado: primero, el texto de la receta se convierte en un vector de números en lo que los investigadores llaman “incrustación de texto”. La IA escanea el texto, ya convertido a números, para encontrar partes similares e intentar “entender” el significado de la receta. Una vez lo tiene, otra red neuronal diferente separa los vectores de texto por un lado y las imágenes por otro.

En segundo lugar, los investigadores emplean otro tipo de redes neuronales llamadas GAN (Redes generativas antagónicas) para generar imágenes nuevas a partir de las que ya tienen. Esto sería como el entrenamiento de la IA, donde tiene que discernir entre si lo que está viendo es una imagen real u otra creada artificialmente. Repitiendo este proceso una y otra vez, el sistema se perfecciona hasta lo que vemos a continuación.

Echando un vistazo a las fotografías se puede comprobar que la IA no es muy buena interpretando platos. Tan solo hay unas pocas recetas llevadas a la práctica de forma más o menos normal: el resto parecen las sobras de la fiesta del fin de semana pasado a las nueve de la mañana o uno de esos vídeos de HowToBasic.

Los investigadores reconocen que la IA no ha podido ofrecer mejores resultados porque las imágenes elegidas para la muestra eran de baja calidad. “Esto se refleja en muchas imágenes borrosas con malas condiciones de iluminación que parece como si fueran gachas de avena y el hecho de que las fotos no son cuadradas, lo que dificulta la formación de los modelos”, explican en el estudio.

También preguntaron a 30 personas que puntuaran la calidad de las imágenes del 1 al 5. De media, la gente dio un 2,9 a la ejecución de la receta presentada por la IA en relación a la receta real y un 3,7 a la similitud de la imagen con la comida real.

Etiquetas
stats