Las Instituciones de Referencia Contraatacan
Encyclopedia Britannica y Merriam-Webster, dos de los editores de referencia más venerables del mundo de habla inglesa, han presentado una demanda contra OpenAI, alegando que la empresa entrenó sus modelos ChatGPT con contenido protegido por derechos de autor sin autorización. La demanda argumenta que OpenAI ha convertido efectivamente el trabajo intelectual de generaciones de editores, lexicógrafos y expertos en la materia en datos de entrenamiento para un sistema de AI comercial, y ahora está utilizando las capacidades resultantes para competir directamente con los editores originales por el tráfico web y los ingresos publicitarios que sustentan sus operaciones.
El reclamo principal es familiar en el creciente cuerpo de litigio sobre derechos de autor de AI: que entrenar un modelo de lenguaje grande con texto protegido por derechos de autor constituye una infracción de derechos de autor, independientemente de si el modelo memoriza pasajes específicos o simplemente incorpora patrones y conocimiento del corpus de entrenamiento. Lo que distingue esta demanda es la directa argumentación del daño competitivo: estas son organizaciones cuyo modelo comercial depende de que los usuarios vengan a sus sitios web para buscar información, usuarios que ahora obtienen sus respuestas de ChatGPT en su lugar.
El Problema de Canibalización de Tráfico
Los demandantes alegan que ChatGPT está canibalizando su tráfico, un término directo para un fenómeno que está remodelando la economía de la información en muchos sectores. Cuando un usuario pregunta a ChatGPT para explicar un evento histórico, definir una palabra o resumir un tema, y recibe una respuesta fluida y completa, no hay razón para que ese usuario visite Britannica o Merriam-Webster. La búsqueda de referencia que podría haber generado una vista de página e ingresos publicitarios ahora ocurre completamente dentro de la interfaz de ChatGPT.
Esta dinámica es existencial para los editores de referencia de una manera que podría no serlo para organizaciones de noticias o creadores de contenido creativo. El modelo comercial de Britannica, que pivotó de las ventas de enciclopedia impresa a la suscripción digital después de que Internet emergiera, depende de que los usuarios tengan una razón para venir a Britannica específicamente. Si los asistentes de AI pueden responder confiablemente preguntas a nivel de enciclopedia, la lógica del tráfico para la suscripción de Britannica puede erosionarse completamente.
Merriam-Webster enfrenta un problema similar. Las búsquedas de diccionario han sido un elemento básico del tráfico web desde la era temprana de Internet, sustentando sitios de diccionarios respaldados por publicidad. Los modelos de AI que pueden definir palabras, explicar etimología, proporcionar ejemplos de uso y aclarar matices de significado, extrayendo de datos de entrenamiento que casi con seguridad incluyeron contenido del diccionario de Merriam-Webster, son un sustituto directo del producto que Merriam-Webster vende.
La Teoría Legal y sus Precedentes
La teoría de infracción de derechos de autor en casos de entrenamiento de AI ha sido controvertida en múltiples frentes desde que The New York Times presentó su demanda histórica contra OpenAI y Microsoft a finales de 2023. La defensa principal de OpenAI: que el entrenamiento en contenido disponible públicamente constituye un uso justo, aún no ha sido completamente juzgada, y los tribunales han emitido señales mixtas sobre la fortaleza del argumento.
El análisis de uso justo implica cuatro factores: el propósito y carácter del uso, la naturaleza de la obra protegida por derechos de autor, la cantidad utilizada y el efecto en el mercado de la obra original. Para los editores de referencia específicamente, el cuarto factor: el efecto del mercado, puede ser el elemento más convincente de su caso. Si pueden demostrar disminuciones medibles en el tráfico e ingresos causalmente vinculados al entrenamiento de OpenAI en su contenido, tienen evidencia que va más allá de la especulación sobre daño hipotético.
Al mismo tiempo, el argumento de uso justo de OpenAI es más fuerte para contenido de referencia fáctico que podría serlo para obras creativas. Los derechos de autor protegen la expresión, no los hechos: las enciclopedias no pueden reclamar derechos de autor en eventos históricos o hallazgos científicos en sí mismos, solo en el lenguaje específico utilizado para describirlos. Esto puede limitar el alcance del alivio que Britannica y Merriam-Webster pueden finalmente obtener incluso si su reclamo de infracción tiene éxito.
Un Patrón Más Amplio de Resistencia del Editor
La demanda se une a un cuerpo sustancial de litigio sobre derechos de autor de AI. The Authors Guild, varias organizaciones de noticias, discográficas, artistas visuales y plataformas de código han presentado o amenazado con demandas. OpenAI ha llegado a acuerdos con algunos editores, más notablemente The Associated Press, y ha licenciado contenido de otros, incluyendo News Corp y The Atlantic.
El patrón sugiere que OpenAI está llegando selectivamente a acuerdos con creadores de contenido cuya cooperación continua tiene valor estratégico: organizaciones de noticias cuyo contenido puede mantener los modelos actualizados, mientras impugna reclamos de partes donde los datos de entrenamiento fueron históricos en lugar de en curso. Si Britannica y Merriam-Webster caen en una categoría donde el acuerdo es más valioso que el litigio dependerá del apalancamiento de negociación, los costos de litigio y la evaluación de OpenAI del riesgo legal que el caso representa para sus argumentos de uso justo más amplios.
Este artículo se basa en reportajes de Gizmodo. Lee el artículo original.

