OpenAI gana la primera batalla a los editores de noticias por usarlas para entrenar a ChatGPT sin permiso

Los próximos años estarán cuajados de resoluciones judiciales clave para determinar si los desarrolladores de sistemas de inteligencia artificial generativa han usado ilegalmente escritos, diseños, voces, imágenes, obras de arte, comentarios o vídeos subidos a Internet por profesionales o usuarios. Material que ha servido para entrenar sus algoritmos sin el permiso de sus creadores y en ocasiones protegido con derechos de autor. En esa contienda, la primera victoria se la ha apuntado OpenAI.

Una jueza federal de Nueva York ha desestimado una demanda de los editores de dos medios de comunicación independientes, Raw Story y AlterNet, que denunciaron que la empresa de inteligencia artificial había hecho un uso ilegítimo de sus artículos. Destacan que OpenAI eliminó la información relativa a la autoría, el titular de miles de sus noticias, así como el hecho de que estaban protegidas por copyright, permitiendo así que ChatGPT la replicara y redistribuyera.

Una actividad que, alegaron, realizó sin tener autorización expresa para ello por parte de sus creadores originales y obteniendo unos beneficios que fueron a parar a sus propias arcas. “Cuando un usuario pregunta a ChatGPT sobre un acontecimiento de actualidad o sobre los resultados de un trabajo de periodismo de investigación, ChatGPT proporcionará respuestas que imitan los trabajos periodísticos protegidos por derechos de autor que cubrieron esos acontecimientos”, citaban como prueba los editores.

“ChatGPT no tiene ningún conocimiento independiente de la información proporcionada en sus respuestas. Más bien, para dar servicio a los clientes de pago de los Demandados, ChatGPT reempaqueta, entre otros materiales, el producto del trabajo periodístico protegido por derechos de autor desarrollado por los Demandantes y otros a su costa”, añadían.

La demanda buscaba una indemnización por los daños causados a los medios y una orden judicial para eliminar el contenido de los conjuntos de entrenamiento de ChatGPT. Sin embargo, la jueza ha cerrado por el momento la puerta a esa opción, indicando que los medios de comunicación no han podido demostrar el perjuicio que ChatGPT les había causado para respaldar la demanda. “Sin un daño concreto, no hay legitimación”, sentencia.

La magistrada expone que la gran cantidad de información que se utilizó en el entrenamiento de ChatGPT hace que la probabilidad de que el programa reproduzca contenido de los artículos de los demandantes es muy baja. “Cuando un usuario introduce una pregunta en ChatGPT, esta IA sintetiza la información relevante de su repositorio en una respuesta. Dada la cantidad de información contenida en el repositorio, la probabilidad de que ChatGPT produzca contenido plagiado de uno de los artículos de los demandantes parece remota”, se lee en la sentencia.

No obstante, la sentencia da otra oportunidad a Raw Story y AlterNet para volver a intentarlo con pruebas sólidas tanto del “riesgo sustancial” de que la actual versión de ChatGPT esté generando respuestas plagiando sus artículos, como del “daño concreto” que esto produce a su negocio. Avisándoles, eso sí, de que ella es “escéptica” de que puedan “alegar un daño reconocible” por lo visto hasta el momento.

El abogado de los demandantes ha afirmado que estos están “seguros” de que podrán “abordar las inquietudes que identificó el tribunal a través de una demanda enmendada” en declaraciones a la Agencia Reuters.

OpenAI, por su parte, ha recalcado la legitimidad de sus acciones para entrenar a ChatGPT. “Construimos nuestros modelos de IA utilizando datos disponibles públicamente, de una manera protegida por el uso justo y principios relacionados, y respaldados por precedentes legales de larga trayectoria y ampliamente aceptados”, ha destacado un portavoz en un comunicado enviado a este medio. A principios de este año la empresa reconoció que habría sido “imposible” entrenar ChatGPT respetando el copyright.

Rivales mayores en el horizonte

Raw Story y AlterNet son dos medios independientes estadounidenses de línea progresista y tienen una audiencia similar, aunque algo mayor en cifras absolutas para el primero (unos cinco millones de lectores mensuales). Raw Story adquirió Alternet en 2018 para formar una empresa de medios compartida para las dos plataformas. John Byrne, fundador de Raw Story, alegó durante la que “las organizaciones de noticias deben plantar cara a OpenAI” por utilizar “el duro trabajo de periodistas cuyos puestos de trabajo están siendo asediados”

OpenAI tiene por delante otros procesos de más envergadura que el protagonizado por Raw Story y AlterNet, aunque este podría sentar un precedente en cuanto a la valoración de los jueces del daño real que las empresas de IA han hecho a los titulares de derechos. El mayor desafío del sector de los medios de comunicación es seguramente la demanda presentada por The New York Times contra la propia OpenAI y Microsoft.

Los argumentos del Times son similares a los de Raw Story y AlterNet. La prestigiosa cabecera argumenta que OpenAI y Microsoft se están beneficiando de la propiedad intelectual del periódico al utilizarla para generar contenidos que compiten con los artículos originales, lo que tiene el potencial de reducir el tráfico y los ingresos del periódico. Aunque la demanda no especifica una cantidad exacta, reclama una indemnización de miles de millones de dólares por ese uso ilícito de sus contenidos.

Pruebas presentadas por el Times en el proceso han demostrado que también pide a las empresas que dejen de utilizar sus artículos en sus datos de entrenamiento y que destruyan cualquier modelo de IA construido con este material.

Sobre OpenAI también pesa la demanda del sindicato de autores de EEUU, al que pertenecen escritores como George R.R. Martin (Canción de hielo y fuego). Estos han denunciado el “robo sistemático” de sus obras por parte de la empresa creadora de ChatGPT, que ya está valorada en 157.000 millones de dólares tras cerrar la mayor ronda de financiación de capital riesgo de la historia.

Pactos con otros editores

Quizá para evitarse más problemas legales, OpenAI también ha firmado importantes acuerdos con editores de noticias para acceder y usar su contenido en el entrenamiento de sus modelos de inteligencia artificial. Entre los pactos más destacados se encuentra uno con la agencia Associated Press (AP), una de las más importantes del mundo; con o News Corp, propietaria de cientos de medios de comunicación como The Wall Street Journal o The Times.

OpenAI también firmó en marzo de este año una asociación exclusiva con el grupo de medios español Prisa, lo que permite a ChatGPT acceder a contenidos publicados por El País, Cinco Días, AS y El HuffPost. “Unir fuerzas con OpenAI nos abre nuevas vías para llegar a nuestras audiencias. Aprovechar las capacidades de ChatGPT nos permite presentar nuestro periodismo de profundidad y de calidad en formatos novedosas, llegando a personas que buscan contenidos rigurosos e independientes. Este es un paso definitivo hacia el futuro de las noticias, donde la tecnología y la experiencia humana se fusionan para enriquecer la experiencia del lector”, aseguró Carlos Núñez, presidente ejecutivo y consejero delegado de Prisa.

Apúntate aquí al boletín de economía

En un momento convulso para las noticias de economía, es más importante que nunca estar bien informado. Las repercusiones de cada movimiento de empresas, de la política económica de los gobiernos y su impacto en los ciudadanos, explicadas desde un punto de vista riguroso y diferente.