Meta, BitTorrent in tožbe zaradi učenja AI: ko siva cona postane pravno tveganje
Medtem ko Meta agresivno gradi lastne modele umetne inteligence, se ji vrača nekaj, kar je v Silicijevi dolini dolgo veljalo za skoraj samoumevno: da je pri zbiranju podatkov za učenje dovolj, če preprosto "vzamete, kar je na voljo". Majhen, a pomemben procesni zasuk v ameriški skupinski tožbi avtorjev – ter sveža odločitev vrhovnega sodišča ZDA o piratstvu – sta nenadoma spremenila precej tehničen spor o BitTorrentu v potencialno prelomnico za celotno industrijo AI.
V nadaljevanju povzemamo, kaj se je zgodilo, zakaj Meta stavi na novo pravno obrambo in zakaj bi moralo to zanimati tudi slovenske založnike, avtorje in AI start-upe.
Novica na kratko
Kot poroča Ars Technica (novinarka Ashley Belanger), se Meta v ZDA sooča z dvema pomembnima tožbama zaradi pridobivanja podatkov za učenje svojih modelov z uporabo BitTorrenta:
- Entrepreneur Media proti Meta – tožba zaradi kršitve avtorskih pravic, kjer tožniki trdijo, da je Meta odgovorna za prispevajočo kršitev, ker je pri sestavljanju učnih podatkov domnevno sejala okoli 80 TB piratskih del prek BitTorrenta.
- Kadrey proti Meta – skupinska tožba avtorjev knjig, ki je bila sprva osredotočena na neposredno kršitev (nedovoljeno distribuiranje) zaradi Metainega torrentanja.
Avtorji so imeli pri neposredni kršitvi težavo: pri BitTorrentu je zelo težko dokazati, da je bil nek naslov dejansko v celoti zasejan. Po poročanju Ars Technice je bila zato strategija Entrepreneur Media pametnejša – sklicujejo se na prispevajočo kršitev, pri kateri je dovolj, da Meta olajša prenos spornih vsebin.
Zdaj je ameriški sodnik Vince Chhabria dovolil, da avtorji dodajo tudi ta, lažje dokazljivi zahtevek v svojo skupinsko tožbo, čeprav je njihove odvetnike ostro okrcal zaradi zamude in pretiranega "zaničevanja" Mete. Meta je medtem sodišče obvestila, da bo pri izpodbijanju prispevajočih zahtevkov uporabila svežo odločitev vrhovnega sodišča v zadevi ponudnika dostopa Cox, ki je omejila odgovornost posrednikov za piratstvo.
Zakaj je to pomembno
Na mizi nista le dve tožbi proti Meti, temveč dve širši vprašanji:
- Ali se lahko veliki AI igralci skrijejo za infrastrukturo, ki jo uporabljajo?
- Ali bodo sodišča pridobivanje učnih podatkov obravnavala kot nekaj posebnega ali zgolj kot še eno obliko množičnega kopiranja?
Novi prispevajoči zahtevek je za Meto nevaren zato, ker cilja na vedenje, ki je precej drugačno od klasične vloge ponudnika dostopa do interneta. Meta naj bi aktivno sejala ogromne količine očitno avtorsko zaščitenih del prek protokola, katerega osnovni namen je prav deljenje datotek. To je precej druga slika kot zgolj "nudimo omrežje, drugi pa ga uporabljajo".
Če bo zadeva prišla pred poroto, se lahko zgodba zelo poenostavi: "Meta se je priključila na omrežje, ki ga povezujemo s piratstvom, vanj potisnila desetine terabajtov nezaščitenih knjig in člankov in izkoristila množico za hitrejše prejemanje." Težko je verjeti, da bo takšno dejansko stanje deležno velike simpatije.
Meta se brani tako, da se sklicuje na odločitev vrhovnega sodišča v primeru Cox. Kot povzema Ars Technica, je sodišče tam začrtalo ostro ločnico: zgolj ponujanje storitve, za katero veste, da jo bodo nekateri zlorabili za kršitev avtorskih pravic, še ne pomeni prispevajoče odgovornosti; praviloma je potrebna aktivna spodbuda k konkretni kršitvi.
To je standard, ki je prijazen ponudnikom dostopa in platformam, ki so en korak stran od samega kopiranja. Če bo Meta uspela prepričati sodišče, da je tudi pri torrentanju zgolj "nevtralni uporabnik tehnologije", bodo imeli imetniki pravic precej več težav pri tožbah proti AI podjetjem.
Obratno pa bi preživetje prispevajoče teorije pomenilo močan precedens: za odgovornost ne bi bilo več nujno rekonstruirati, katera datoteka knjige je končala pri kom. Dovolj bi bilo dokazati, da je laboratorij zavestno uporabil mehanizem, katerega običajno delovanje predvidljivo razširja nezaščitena dela v velikem obsegu.
Z drugimi besedami: ta primer postaja test, kako daleč je pripravljen iti copyright, ko gre za tehnično "vodovod" učenja AI.
Širši kontekst
Metini problemi z BitTorrentom se lepo vklapljajo v tri večje trende:
Prehod od "scrapanja" k množičnemu zajemu zbirk. Prve generativne modele so podjetja večinoma hranila z avtomatskim branjem javno dostopnih spletnih strani – pravno megleno, a tehnično razpršeno. Torrentanje 80 TB skrbno izbranih vsebin je nekaj drugega: bolj spominja na direkten priklop na senčne knjižnice in piratske arhive.
Tožbe zaradi učnih podatkov kot vzvod. Od leta 2023 naprej spremljamo val tožb proti OpenAI, Microsoftu, Stability AI in drugim zaradi učenja na knjigah, novicah in kodi. Večina se vrti okoli vprašanja, ali je nekonsenzualno kopiranje za učenje sploh kršitev in ali so izhodi modelov "bistveno podobni" izvirnikom. Torrentanje pa sodišča že zelo dobro poznajo iz obdobja Napsterja in BitTorrenta – ta zgodovina prinaša jasnejšo intuitivno reakcijo.
Preoblikovanje pravil o posredni odgovornosti. Zadeva Cox in starejši primeri v ZDA gradijo trend: sodišča želijo zaščititi splošno infrastrukturo, obenem pa kaznovati tiste, ki k piratstvu aktivno vabijo. Meta želi stati na strani infrastrukture, čeprav dejansko deluje kot zelo napreden končni uporabnik.
To presega zgolj Meto. Vsak AI laboratorij, ki je uporabljal npr. velike neavtorizirane zbirke e‑knjig ali akademske zrcalne strani, je zdaj opozorjen: tožniki bodo vedno bolj napadali vodovod podatkov, ne le izhod modela.
Zanimiv je tudi sodnikov očitek odvetnikom avtorjev: namesto na natančno grajenje primera naj bi se preveč osredotočali na javno "kazen" za Meto. To je opozorilo tudi evropskim pravnikom – sodišča so pripravljena poslušati drzne teorije o AI, a pričakujejo procesno disciplino, ne moralnih manifestov.
Meta po drugi strani uporablja preverjeno platformno strategijo: maksimalno izkoriščanje vseh procesnih in doktrinarnih odprtin (nižji standard za prispevajočo odgovornost, argumenti o pomanjkanju konkretnega znanja, odlaganje razkritij), da postane postopek za tožnike čim dražji in bolj nepredvidljiv.
Evropski zorni kot
Iz evropskega vidika je zgodba še bolj zanimiva, ker je pravni okvir drugačen.
EU je s pravnimi izjemami za besedilno in podatkovno rudarjenje (TDM) že uvedla možnost, da raziskovalci in podjetja pod določenimi pogoji izvajajo učenje na zaščitenih delih – vendar z jasnim opt‑outom za imetnike pravic. Prihajajoči Akt o umetni inteligenci (EU AI Act) pa bo od ponudnikov velikih osnovnih modelov zahteval vsaj osnovno transparentnost o vrstah učnih podatkov ter spoštovanje avtorskega prava držav članic.
Če bi Meta podoben torrentni sistem poganjala na strežnikih v EU in pri tem obdelovala dela evropskih avtorjev, ki so se iz TDM izrecno izključili, bi bil njen položaj precej šibkejši kot v ZDA – ne glede na Cox.
Za slovenske založnike, avtorje in start-upe je pomembno dvoje:
- Precedens v ZDA vpliva na pogajalsko moč. Če ameriška sodišča priznajo široko prispevajočo odgovornost pri takšnih podatkovnih ceveh, bodo globalna AI podjetja precej bolj motivirana za sklenitev kolektivnih licenc tudi v EU, namesto da tveganje nosijo sama.
- Majhni jeziki so posebej ranljivi. Če bo sporočilo sodne prakse, da je množično, neavtorizirano zajemanje knjig relativno nizko tvegano, bo spodbuda za legalno licenciranje del v slovenščini ali hrvaščini še manjša. A prav ti jeziki so za lokalne modele najbolj kritični.
Slovenski ekosistem – od založb do AI podjetij iz Ljubljane, Maribora ali Celja – bi moral ta primer brati kot opozorilo: gospodarjenje z učnimi podatki bo zelo kmalu postalo prav tako pomembno konkurenčno orožje kot sama arhitektura modelov.
Pogled naprej
V naslednjih 12–18 mesecih bo ključno spremljati:
Metin dodatni vlog o zadevi Cox. Koliko bo poskušala svojo vlogo pri torrentanju prikazati kot analogno vlogi ponudnika dostopa? Bolj ko bo stala na tej analogiji, več možnosti ima sodišče, da jasno loči med pasivno infrastrukturo in aktivnim sejanjem.
Odločanje o skrajšanem postopku (summary judgment). Sodnik Chhabria je jasno povedal, da Meta v skupinski tožbi ne bo soočena z obsežnim razkritjem dokumentov, dokler avtorji ne prestanejo te faze pri zahtevkih za distribucijo in prispevajočo kršitev. Če bo prispevajoči zahtevek preživel, se bo razmerje moči obrnilo – Meta bi se lahko znašla pred zelo neprijetnimi vpogledi v interne razprave o torrentanju.
Spori o odvetniški tajnosti. Tožniki že namigujejo, da bodo v primeru delne zmage poskušali izpodbijati, da bi bile interne razprave o strategiji torrentanja zaščitene kot zaupne. Odločitev, ki bi odprla takšna interna gradiva, bi bila zelo neprijetna precedenčna zgodba za celoten AI sektor.
Možen premik k poravnavam. Če se bodo druge AI tožbe po svetu nadaljevale s kombinacijo delnih zmag in porazov, bo skušnjava za globalno poravnavo – denar + določene licence + mehanizmi opt‑out – vse večja. To bi se dobro ujemalo z usmeritvijo, ki jo EU že nakazuje.
Moja napoved: odločitev v zadevi Cox bo Meti verjetno pomagala omejiti obseg prispevajoče odgovornosti, vendar ji ne bo prinesla čiste zmage. Težko si je predstavljati, da bi sodišče subjekt, ki naj bi zavestno sejál desetine terabajtov knjižnih datotek, enačilo s pasivnim ISP‑jem. Tudi delni uspeh avtorjev bo AI laboratorijem jasno sporočilo, da "sive" podatkovne cevi niso dolgoročno vzdržna strategija.
Ključna misel
Metin poskus, da zelo aktivno uporabo BitTorrenta zakrije za pravni standard, namenjen pasivnim ponudnikom dostopa, je tvegan. Tudi če ji vrhovno sodišče ZDA nekoliko zniža tveganje pri prispevajoči odgovornosti, to ne spremeni dejstva, da je šlo za zavestno odločitev za uporabo protokola, ki množično razmnožuje zaščitena dela. Za slovenska in evropska AI podjetja je sporočilo jasno: obdobje "vzemi vse, kar najdeš" se končuje. Ključno vprašanje je, ali bomo prešli na pregledno, licenčno učenje – ali pa bodo to uredile šele sodišča in regulatorji.



