Ko slovar toži klepetalnika: kaj nam pove spor Britannica–OpenAI o prihodnosti znanja

1. Naslov in uvod

Najprej so se na generativni AI razjezili časopisi. Zdaj pa je na vrsti sama infrastruktura znanja: enciklopedije in slovarji. Encyclopedia Britannica in Merriam‑Webster sta vložila tožbo proti OpenAI, ker naj bi ChatGPT nezakonito uporabljal njuno vsebino, hkrati pa jo nadomeščal in jo napačno citiral. To ni samo še ena avtorskopravna bitka – gre za vprašanje, kdo bo v dobi velikih jezikovnih modelov nadzoroval avtoritativne informacije. V tem komentarju razčlenjujemo, zakaj je ta tožba nevarnejša za OpenAI, kot se zdi, in kaj pomeni za evropske – tudi slovenske – založnike.

2. Novica na kratko

Po poročanju TechCruncha sta Encyclopedia Britannica in njena hčerinska družba Merriam‑Webster 16. marca 2026 v ZDA vložili tožbo proti OpenAI. V njej trdita, da je OpenAI zagrešil »množično kršitev avtorskih pravic«, ker naj bi brez dovoljenja pobral skoraj 100.000 spletnih člankov Britannica in jih uporabil za učenje svojih jezikovnih modelov.

Britannica nadalje zatrjuje, da ChatGPT včasih generira odlomke, ki v celoti ali deloma dobesedno posnemajo njena besedila, ter da OpenAI njene članke uporablja tudi v t. i. RAG‑delovnem toku (retrieval‑augmented generation), ko model ob odgovarjanju sproti išče informacije v zunanjih virih. Poleg avtorskega prava tožba omenja še kršitev zakona Lanham (tržne znamke), kadar ChatGPT halucinira in napačne podatke pripiše Brittanici.

Založnik trdi, da ChatGPT neposredno konkurira njegovim spletnim stranem, zmanjšuje obisk in prihodke ter ogroža dostop javnosti do zanesljivih referenčnih informacij. Britannica ima podobno tožbo tudi proti Perplexity, pridružuje pa se vrsti drugih medijskih hiš, ki so že vložile tožbe proti OpenAI.

3. Zakaj je to pomembno

Ta tožba cilja hkrati na tri temelje trenutnega poslovnega modela generativne umetne inteligence:

Učenje na množično pobranih spletnih podatkih brez individualnih licenc
Generiranje izhodov, ki so lahko zelo podobni izvirnim besedilom
Zanašanje na ugled blagovnih znamk, ko model halucinacije predstavi kot informacije »po Brittanici« ali podobnih avtoritetah

Prejšnje tožbe (npr. velikih medijskih hiš) so se osredotočale predvsem na prvi dve točki. Britannica pa v ospredje postavi zaupanje in ugled. Za referenčnega založnika ni problem samo, če AI kopira njegove članke; veliko huje je, če AI izmišlja neumnosti in jih podtakne pod njegovo ime.

Kdo ima od tega korist? Kratkoročno predvsem imetniki pravic. Enciklopedije in slovarji niso navaden spletni šum, ampak hrbtenica številnih učnih korpusov. Če bo Britannica dosegla vsaj delni uspeh, bo to okrepilo pogajalski položaj specializiranih ponudnikov vsebin – od medicinskih baz do pravnih zbirk.

Kdo izgublja? Predvsem laboratoriji za generativno AI, ki stavijo na ogromne modele, trenirane na čim več spleta. Tudi če bodo sodišča na koncu pritrdila, da je samo učenje lahko »poštena uporaba«, bodo zelo pozorna na to, kako je bil material pridobljen in kako so predstavljeni izhodi. Posledice:

več plačljivih licenčnih dogovorov namesto tihega strganja vsebine,
strožji filtri proti dobesednemu kopiranju,
jasnejša pravila glede uporabe blagovnih znamk in citiranja znotraj klepetalnikov.

V praksi to pomeni več negotovosti za vsakega ponudnika splošnih AI‑storitev, ki odgovarja na faktografska vprašanja. Podjetja in šole bodo še previdnejša, morda se bo okrepila niša manjših, domensko usmerjenih modelov z jasno urejenimi pravicami do podatkov.

4. Širši kontekst

Tožba Britannica–OpenAI je del širšega procesa, v katerem se industrija vsebin z tožbami pogaja z AI‑platformami o novih pogojih sodelovanja.

Podoben scenarij smo že videli pri iskalnikih. Google in drugi so pobirali naslove in izvlečke novic, založniki so tožili, sledila je serija sporov in na koncu kombinacija novih pravic (npr. pravica založnikov novic v EU), prilagoditev prikaza rezultatov ter licenčnih dogovorov. Razlika je, da generativni modeli uporabnika ne vračajo na izvorno stran, ampak poskušajo sami ponuditi celoten odgovor.

V zadnjih mesecih se izrisuje nekaj pomembnih trendov:

Po navedbah TechCruncha je ameriški sodnik v zadevi proti podjetju Anthropic ocenil, da je uporaba avtorskih del kot učnih podatkov lahko dovolj preoblikovalna, da spada v okvir zakonite uporabe – a je hkrati kaznoval način, kako so bila dela nepooblaščeno prenesena, kar je vodilo do zelo visoke poravnave z avtorji.
Veliki založniki, kot sta The New York Times in Ziff Davis, trdijo, da ChatGPT ne le uči na njihovih člankih, ampak z odgovori neposredno nadomešča obisk njihovih spletnih mest.
Britannica Perplexityju očita tudi način ovijanja odgovorov v znamko – kot da bi AI sam postal nova enciklopedija, ki si ugled izposodi pri klasičnih virih.

Skupna slika: sodišča bodo verjetno razlikovala med tem, da model uči na delih, ter med tem, kako so ta dela pridobljena in kako se izhodi uporabljajo v ekonomiji pozornosti.

Konkurenčno gledano to pospešuje razkol med:

kapitalsko močni igralci (OpenAI, Google, Meta, Anthropic), ki si lahko privoščijo licenčnine in pravne ekipe, ter
manjšimi ali odprtokodnimi projekti, ki so bolj odvisni od prosto dostopnih podatkov in bodo verjetno potisnjeni v ožje domene ali v uporabo sintetičnih podatkov.

Smer razvoja je precej jasna: splošnonamenska AI, ki želi odgovarjati na dejstva, bo morala nastajati na pogodbah, ne le na pajkih.

5. Evropski in slovenski kot

Čeprav je tožba vložena v ZDA, ima neposredne posledice tudi za Evropo.

EU ima z Direktivo o avtorski pravici na enotnem digitalnem trgu že posebna pravila za besedilno in podatkovno rudarjenje (TDM). Načeloma lahko razvijalci AI za učenje uporabljajo zaščitena dela, vendar se lahko imetniki pravic izključijo. Poleg tega poznamo še specifične podatkovne baze, moralne pravice avtorjev in prihajajoči Akt o umetni inteligenci, ki bo zahteval več transparentnosti glede učnih podatkov.

Za slovenske založnike – od medijskih hiš do znanstvenih zbir – je zadeva Britannica pomembna predvsem kot signal, da specializirani viri niso brez moči. Če bo sodišče naklonjeno enciklopediji, bo več zanimanja za kolektivne modele licenciranja in za to, da se vsebine ne prepustijo zgolj spletnim pajkom.

Za slovenske uporabnike lahko to pomeni dve stvari:

V scenariju brez dogovorov lahko nastanejo vrzeli v znanju v slovenščini, ker bodo kakovostni viri zadržani za lastne portale ali zaprte storitve.
V scenariju z dogovori pa lahko dobimo bolj zanesljive lokalizirane modele, ki bodo odgovore vezali na preverjene, plačane vire – morda tudi na domače enciklopedične projekte.

Regulatorno gledano je tožba tudi opomnik, da je haluciniranje in napačno navajanje virov pri generativni AI lahko predmet ne le avtorskega prava, temveč tudi pravil o varstvu potrošnikov in preprečevanju zavajanja – področij, ki ju v EU pokrivata Akt o digitalnih storitvah in nova pravila o preglednosti algoritmov.

6. Pogled naprej

Možnih scenarijev je več.

1. Tiha poravnava kot nov standard.
Najverjetnejši izid ni spektakularna sodba Vrhovnega sodišča, ampak poravnava. Če bo v ozadju stekel denar in zaveze – na primer uradno licenciranje, prilagojen način citiranja ali skupni produkti – bo ta dogovor postal de facto predloga za pogajanja drugih založnikov z AI‑podjetji.

2. Tehnične varovalke okoli referenčnih vsebin.
Ne glede na izid ima OpenAI močno produktno motivacijo, da odpravi halucinacije, pripisane Brittanici ali drugim znamkam. Pričakovati je:

strožja pravila, kdaj sme ChatGPT reči »po Brittanici« ali »po Merriam‑Webstru«,
bolj vidne povezave na vire in morda obvezne opombe,
agresivno filtriranje besedil, ki preveč spominjajo na enciklopedične članke.

Če tega ne bo naredil prostovoljno, bo pritisk prišel s strani sodišč ali regulatorjev.

3. Fragmentacija ekosistema znanja.
Referenčni založniki se bodo verjetno razdelili v tri skupine:

tiste, ki bodo licencirali svojo vsebino velikim modelom in živeli znotraj klepetalnikov,
tiste, ki bodo poskušali zgraditi lastne AI‑rešitve nad svojimi bazami,
in tiste, ki jim manjka obsega in bodo težko prišli v katerokoli izmed teh lig.

Za slovenska podjetja in javne institucije bo ključno vprašanje: ali lahko dokažete, da je vaš model treniran in deluje na podatkih, za katere imate pravico uporabe? Sledenje izvoru podatkov in upravljanje pravic bosta postala tako pomembna kot sama kakovost modela.

V naslednjih 12–24 mesecih bo vredno spremljati:

ali se bodo podobno kot Britannica odzvali tudi specializirani evropski viri (medicina, pravo, nacionalne enciklopedije),
kako bodo največji modeli spremenili prikaz virov in citatov v uporabniškem vmesniku,
ali bo EU prek Akta o digitalnih storitvah in Akta o AI začela neposredno naslavljati zavajajoče pripisovanje virov.

7. Bistvo

Spor Britannica–OpenAI ostro zastavi vprašanje: ali lahko AI‑podjetja iz referenčnih del naredijo univerzalni odgovorni stroj, ne da bi plačala za vsebino in prevzela standarde točnosti, ki jih ta dela predstavljajo? Moj pogled: obdobje »treniraš na vsem, kar najdeš«, se izteka. Modeli, ki si lastijo avtoriteto, bodo morali temeljiti na jasnih pogodbah z avtoritetami znanja – in bodo ocenjevani po tem, kako pošteno jih predstavljajo. Odprto ostaja, ali bo to znanje dostopno široko ali zaklenjeno v nekaj korporativnih silosih.

Ko slovar toži klepetalnika: kaj nam pove spor Britannica–OpenAI o prihodnosti znanja

1. Naslov in uvod

2. Novica na kratko

3. Zakaj je to pomembno

4. Širši kontekst

5. Evropski in slovenski kot

6. Pogled naprej

7. Bistvo

Komentarji

Pustite komentar

Povezani članki

Picsartovi AI agenti: manj klikanja, več režije – in več odvisnosti od platform

NemoClaw: kako želi Nvidia iz varnostne šibke točke narediti svojo najmočnejšo orožje

AI proti avtentičnosti: kaj razkriva »vibe coded« prevajalnik v igričarski zgodovini

Ostani na tekočem