Microsoft y OpenAI dan otro golpe de efecto con un nuevo ChatGPT que también interpreta imágenes

La nueva inteligencia artificial puede extraer información de fotografías o documentos que integren imágenes y texto, así como construir textos mejor que ChatGPT
— Quién está detrás de OpenAI, la creadora de la inteligencia artificial ChatGPT

Una de las interacciones basadas en imágenes compartidas por OpenAI sobre GPT-4. El interlocutor pregunta al sistema qué ocurriría si las cuerdas se cortaran, y este responde que "los globos se irían volando".

14 de marzo de 2023 19:22 h

Actualizado el 14/03/2023 19:31 h

Seguir al autor/a

La revolución de la inteligencia artificial no termina con ChatGPT. Al contrario, esta tecnología ha sido solo un prólogo de lo que está por venir. OpenAI ha presentado este martes el nuevo GPT-4, un modelo de lenguaje natural que puede interpretar imágenes, explicarlas o debatir sobre lo que se ve en ellas. También es “más fiable, creativo y capaz de manejar instrucciones mucho más matizadas” con texto escrito que ChatGPT, ha explicado OpenAI, que junto con Microsoft, da así otro golpe de efecto en la carrera de la inteligencia artificial cuando su competencia aún está tratando de emular su modelo anterior.

La principal novedad de GPT-4 es su capacidad de extraer información de imágenes, texto, o formatos que mezclen imágenes y texto. “En una amplia gama de dominios, como documentos con texto y fotografías, diagramas o capturas de pantalla, GPT-4 muestra capacidades similares a cuando se introduce solo texto”, presume OpenAI. No obstante, esta capacidad de analizar imágenes “sigue siendo un avance de investigación y no está disponible públicamente”, avisa la empresa.

Al contrario que ChatGPT, GPT-4 no estará abierto al público general. Para acceder a él será necesario tener una suscripción a ChatGPT Plus (20 dólares al mes más IVA) o bien contratar el acceso para desarrolladores, cuyo precio varía en función del número de consultas que se hagan al sistema. La nueva inteligencia artificial también tiene un conocimiento limitado de la actualidad (solo tiene datos hasta septiembre de 2021) y no tendrá un aprendizaje automático a partir de sus conversaciones con los usuarios.

OpenAI asegura que su nuevo producto también puede argumentar y construir discursos mucho mejor que ChatGPT. Este se basa en una evolución de su anterior modelo conversacional, GPT-3, adaptado para interactuar y “chatear” de manera más fluida con las personas. La empresa lo denomina GPT-3.5. “Hace un año, entrenamos GPT-3.5 como primera ”prueba“ del sistema. Encontramos y corregimos algunos errores y mejoramos nuestros fundamentos teóricos. Como resultado, nuestra ejecución de entrenamiento de GPT-4 fue (¡al menos para nosotros!) de una estabilidad sin precedentes”, afirman.

Capaz de aprobar cualquier examen

“En una conversación informal, la distinción entre GPT-3.5 y GPT-4 puede ser sutil. La diferencia sale a relucir cuando la complejidad de la tarea alcanza el umbral suficiente”, explica OpenAI. Como muestra de ello han compartido los resultados de GPT-4 en una gran variedad de exámenes académicos y de profesiones especializadas. Según sus datos, que este medio no ha podido contrastar, GPT-4 no solo es capaz de aprobarlos todos, sino que además sus resultados se acercan a los que obtienen los mejores estudiantes humanos.

“Por ejemplo, supera un examen de abogacía simulado con una puntuación que se coloca en el 10% de mejores examinados; en cambio, la puntuación de GPT-3.5 se situó en el 10% peor”, detallan: “No realizamos ningún entrenamiento específico para estos exámenes”.

Desde OpenAI explican que también han mejorado la fiabilidad del sistema y corregido errores que hacen que su predecesor fuera vulnerable a hackeos que hacían que insultara, difundiera odio o desinformación, como demostró elDiario.es. “Hemos dedicado 6 meses a hacer que GPT-4 sea más segura. GPT-4 tiene un 82% menos de probabilidades de responder a solicitudes de contenido no permitido y un 40% más de probabilidades de producir respuestas objetivas que GPT-3.5 en nuestras evaluaciones internas”.

Todos los analistas esperaban que GPT-4, llegara este 2023. Sobre todo después de que Microsoft turbocapitalizara la empresa con 10.000 millones de dólares a cambio de un acceso prioritario a su tecnología. La multinacional le ha declarado una guerra abierta a Google que puede revolucionar la vida digital, con la incorporación de asistentes conversacionales a las herramientas de uso diario de cada compañía. Microsoft ya ha anunciado que esta tecnología estará disponible en su buscador Bing, en Excel, en Word o en el propio Windows. Google, por su parte, ha confirmado este mismo partes que hará lo propio con Gmail o con Google Docs.

Etiquetas