Cuando la IA compite con la enciclopedia: lo que revela la demanda de Britannica contra OpenAI

1. Titular e introducción

Durante años, la pelea fue «medios vs. plataformas». Con la demanda de Encyclopedia Britannica y Merriam‑Webster contra OpenAI, el conflicto sube de nivel: ahora la IA se mide directamente con las fuentes de referencia que han definido el conocimiento general durante más de un siglo. No estamos ante una demanda más por copyright, sino ante la pregunta de quién controlará la información fiable en la era de los modelos de lenguaje. En este análisis veremos por qué este caso es especialmente delicado para OpenAI, cómo encaja en las tendencias de la industria y qué implica para los mercados hispanohablantes y europeos.

2. La noticia en breve

Según informa TechCrunch, Encyclopedia Britannica y su filial Merriam‑Webster presentaron el 16 de marzo de 2026 una demanda en Estados Unidos contra OpenAI. Alegan «infracción masiva de copyright» al acusar a la empresa de haber extraído casi 100.000 artículos online de Britannica sin permiso para entrenar sus modelos de lenguaje.

La demanda sostiene además que ChatGPT puede generar fragmentos que reproducen total o parcialmente el texto original, y que OpenAI utiliza contenidos de Britannica en su flujo de generación aumentada por recuperación (RAG), el mecanismo con el que el modelo consulta la web u otras bases de datos para ofrecer información actualizada. Britannica también acusa a OpenAI de violar la Ley Lanham (marcas y competencia desleal) cuando el sistema inventa datos y se los atribuye falsamente a la enciclopedia.

El editor argumenta que ChatGPT sustituye respuestas que antes llegaban mediante visitas a sus webs, reduciendo tráfico e ingresos y poniendo en riesgo el acceso público a información fiable. Britannica ya mantiene una demanda similar contra Perplexity y se suma así a otros grupos mediáticos que han llevado a OpenAI a los tribunales.

3. Por qué importa

Esta demanda es importante porque ataca simultáneamente tres supuestos clave del modelo de negocio actual de la IA generativa:

Que se puede entrenar con todo lo que haya en la web sin licencias individuales.
Que las reproducciones casi literales de textos protegidos son un «daño colateral» aceptable.
Que los chatbots pueden apropiarse del prestigio de marcas de referencia siempre que solo generen texto.

Los anteriores pleitos de medios se concentraban sobre todo en el punto 1. Britannica va más allá y centra el tiro en el valor de la confianza. La enciclopedia no vende solo artículos, vende reputación. Si ChatGPT mezcla errores con el sello «según Britannica», está dañando el producto principal de la casa.

¿Quién gana con este movimiento? A corto plazo, los editores especializados: diccionarios, bases de datos jurídicas, literatura científica. Si un tribunal considera que una enciclopedia merece una protección reforzada, todos los actores que juegan en esa liga ganan poder negociador frente a las big tech.

¿Quién pierde? Fundamentalmente, los grandes laboratorios de IA generalista. Incluso si los jueces terminan avalando –como sugiere TechCrunch en el caso de Anthropic– que el uso de obras como datos de entrenamiento puede ser transformador y legal, todavía quedan dos frentes espinosos:

el modo de obtención de esos datos (descargas masivas sin permiso vs. licencias),
y el efecto sustitutivo (si la respuesta de la IA compite directamente con el servicio original).

La consecuencia práctica: más presión hacia acuerdos de licencia con los grandes proveedores de contenido, más inversión en filtros técnicos contra el copiado literal y más cuidado con cómo se citan y presentan las fuentes dentro de ChatGPT.

4. El contexto amplio

La demanda de Britannica no aparece en el vacío. Forma parte de una estrategia más amplia de la industria de contenidos: negociar a golpe de litigio las nuevas reglas del juego con la IA.

Ya vivimos algo similar con Google News y los agregadores de noticias. Los buscadores indexaban titulares y entradillas, los editores denunciaban pérdida de control y de ingresos, y se abrió una larga batalla que en Europa acabó en nuevas figuras jurídicas (como el derecho conexo de los editores de prensa) y, finalmente, en acuerdos comerciales. La diferencia crucial es que los modelos generativos no redirigen tráfico: su propuesta es que el usuario resuelva todo sin salir del chat.

En paralelo, se acumulan señales importantes:

TechCrunch recuerda que en un caso contra Anthropic un juez estadounidense vio con buenos ojos la idea de que usar obras como material de entrenamiento puede ser transformador, pero consideró ilegal el modo de descarga masiva de millones de libros, lo que desembocó en un acuerdo millonario.
Grandes grupos como The New York Times o Ziff Davis han demandado a OpenAI argumentando que ChatGPT no solo aprende de sus webs, sino que en muchos casos sustituye la visita del lector.
Britannica, tanto contra OpenAI como contra Perplexity, pone el foco en la escenificación de la autoridad: el chatbot se presenta casi como una nueva enciclopedia, apoyándose en marcas históricas sin respetar sus estándares.

La tendencia de fondo es clara: los tribunales empiezan a separar tres niveles distintos:

Aprender de las obras (quizá aceptable bajo ciertas condiciones).
Cómo se consiguen los datos (scraping masivo vs. licencias y APIs).
Cómo se muestran las respuestas y qué marcas o fuentes se invocan.

Competitivamente, esto acelera una brecha entre:

Un puñado de actores con mucho capital (OpenAI/Microsoft, Google, Meta, Anthropic) capaces de firmar grandes acuerdos de datos.
Y un ecosistema de modelos abiertos y startups que tendrán que apoyarse más en datos realmente abiertos, en colecciones públicas o en dominios nicho.

La moraleja para la industria es obvia: la IA de propósito general ya no se construirá solo con web crawlers, sino con contratos y compliance.

5. El ángulo europeo e hispanohablante

Desde Europa, este caso se lee a través de un prisma regulatorio distinto.

La UE ya contempla excepciones para minería de textos y datos (TDM) en la Directiva de Copyright, pero con una cláusula de opt‑out: los titulares de derechos pueden excluir sus obras si lo indican de forma clara. Además existen los derechos sui generis sobre bases de datos, el fuerte componente de derechos morales en algunos países y la inminente entrada en vigor del Reglamento de IA (AI Act), que exigirá transparencia sobre datos de entrenamiento en modelos de alto impacto.

Para los mercados hispanohablantes el asunto tiene dos caras:

En Europa, tras la experiencia del «canon AEDE» y el cierre de Google News en España durante años, los editores han aprendido que llevar el pulso al límite puede salir caro. Es probable que la demanda de Britannica refuerce la opción de acuerdos de licencia tempranos con las plataformas de IA.
En América Latina, donde muchos países carecen de grandes grupos de referencia y los mercados son más fragmentados, existe el riesgo de que el contenido local acabe infrarepresentado si no hay actores capaces de sentarse a negociar de tú a tú con las big tech.

Para los usuarios hispanohablantes, el escenario de fondo es este: si diccionarios, enciclopedias y bases de datos de calidad se cierran en banda, podríamos ver modelos muy potentes en inglés pero mediocres en español, sobre todo en dominios especializados. Si, por el contrario, se logran acuerdos razonables, podrían surgir chatbots con respuestas verificadas y bien citadas en nuestra lengua, algo clave en educación, sanidad y administración.

6. Mirando hacia adelante

¿Qué puede pasar a partir de ahora?

1. Acuerdo confidencial como referencia de mercado.
Lo más probable es que este caso no llegue a un gran fallo doctrinal, sino a una transacción. Si Britannica consigue dinero y compromisos estructurales (licencias formales, reglas claras de citación, quizá productos conjuntos), ese acuerdo se convertirá de facto en el patrón de referencia para otras negociaciones en todo el mundo.

2. Barreras técnicas contra el uso indebido de marcas.
OpenAI tiene incentivos comerciales y legales para reducir al mínimo las alucinaciones atribuidas a fuentes concretas. Es razonable esperar:

criterios más estrictos para que ChatGPT diga «según Britannica…»,
citas y enlaces a fuentes más visibles y verificables,
filtros que bloqueen respuestas demasiado cercanas al texto original.

Si la empresa no actúa, es probable que lo hagan los reguladores, especialmente en la UE bajo el paraguas del DSA y del AI Act.

3. Nuevos equilibrismos para editores y startups.
Las editoriales de referencia tienen por delante varias estrategias posibles:

convertirse en proveedores oficiales de datos para los grandes modelos,
desarrollar sus propios copilotos o asistentes especializados,
o replegarse en modelos de suscripción cerrados, asumiendo que parte del tráfico se irá a la IA generalista.

Para las startups y empresas de la región, la pregunta clave será: ¿puedes demostrar de dónde salen los datos de tu modelo y qué permisos tienes? La trazabilidad de datos se vuelve un requisito básico para vender IA a bancos, hospitales, gobiernos o grandes corporaciones.

En los próximos 12–24 meses convendrá vigilar:

si otras editoriales de referencia (médicas, jurídicas, técnicas) siguen el camino de Britannica,
cómo cambian las condiciones de uso de las APIs de LLM en materia de garantías de propiedad intelectual,
y si los reguladores europeos empiezan a sancionar explícitamente los desajustes entre lo que la IA afirma citar y lo que realmente usa.

7. Conclusión

La demanda de Britannica y Merriam‑Webster plantea de forma frontal la cuestión de si las empresas de IA pueden transformar las grandes obras de referencia del mundo en un motor de respuestas sin pagar por ello ni someterse a sus estándares de rigor. Mi opinión: la época del «entrena con todo lo que encuentres» toca a su fin. La autoridad en IA se construirá sobre acuerdos explícitos con las autoridades del conocimiento, y se juzgará por la honestidad con la que representa sus voces. La duda es si ese futuro será plural y abierto o un oligopolio de pocos silos controlados por las mismas manos.

Cuando la IA compite con la enciclopedia: lo que revela la demanda de Britannica contra OpenAI

1. Titular e introducción

2. La noticia en breve

3. Por qué importa

4. El contexto amplio

5. El ángulo europeo e hispanohablante

6. Mirando hacia adelante

7. Conclusión

Comentarios

Deja un comentario

Publicaciones relacionadas

Mistral Forge: del consumo de GPT a la propiedad real de la IA en la empresa

World ID quiere poner tu iris detrás de cada agente de IA: ¿solución elegante o distopía privatizada?

El divorcio entre el Pentágono y Anthropic: la primera gran derrota del "AI ético" militar

Mantente informado