DeepSeek V4: kineski AI div koji trese cijene i živce u EU
DeepSeekov novi model V4 nije samo još jedan veliki jezični model – to je otvorena objava cjenovnog rata vodećim američkim igračima. Mješovita arhitektura eksperata (MoE), kontekst od milijun tokena i cijene ispod GPT‑5.x i Geminija 3.x stavljaju kineski laboratorij rame uz rame s tzv. frontier modelima. Za Hrvatsku i širu SEE regiju to znači pristup snažnim modelima po bitno nižoj cijeni, ali i nova pitanja oko povjerenja, regulative i geopolitičke ovisnosti.
1. Vijest ukratko
Prema pisanju TechCruncha, kineski AI laboratorij DeepSeek predstavio je preview verzije svoje nove generacije velikih jezičnih modela pod nazivom DeepSeek V4. Zasad postoje dva modela: V4 Flash i V4 Pro. Oba koriste mixture‑of‑experts arhitekturu i podržavaju kontekstualni prozor od čak milijun tokena, što omogućuje analizu cijelih kodnih baza ili velikih skupova dokumenata u jednom upitu.
V4 Pro ima ukupno oko 1,6 bilijuna parametara, od čega je po jednom pozivu aktivno 49 milijardi. Time je, prema DeepSeeku, najveći javno dostupan open‑weight model na tržištu. Manji V4 Flash raspolaže s oko 284 milijarde parametara i 13 milijardi aktivnih. Oba modela, navodi tvrtka, značajno nadmašuju prethodni V3.2 u zadacima zaključivanja i programiranja te se na nekim mjerilima približavaju ili čak nadmašuju zatvorene modele OpenAI‑a i Googlea.
Za razliku od mnogih konkurentskih modela, trenutne preview verzije su isključivo tekstualne – bez slike, zvuka i videa. Njihova ključna prednost je cijena: trošak tokena za ulaz i izlaz niži je od usporedivih modela GPT‑5.x, Gemini 3.x i Claude 4.x. Lansiranje dolazi samo dan nakon što su Sjedinjene Države optužile Kinu za sustavnu krađu intelektualnog vlasništva u području AI‑ja, a DeepSeek je već ranije bio prozivan od strane OpenAI‑a i Anthropica zbog navodnog »destiliranja« njihovih modela.
2. Zašto je to važno
DeepSeek V4 je važan jer mijenja ekonomiju, ravnotežu snaga i percepciju rizika u AI svijetu.
Ekonomija: Za svaku tvrtku koja već danas plaća tisuće eura mjesečno za korištenje GPT‑a ili Geminija, cijena po milijun tokena je presudna. Ako DeepSeek doista nudi razinu zaključivanja i kodiranja koja je svega nekoliko mjeseci iza najboljih frontier modela, a pritom je značajno jeftiniji, pritisak na postojeće cijene bit će ogroman. To posebno vrijedi za regionalne startupe u Zagrebu, Beogradu ili Sarajevu, koji svaki euro uložen u oblak moraju maksimalno rastegnuti.
Ravnoteža snaga: Do sada je geopolitička priča bila relativno jednostavna: Europa i SEE regija ovise o američkim modelima i američkoj infrastrukturi. Pojava snažnog, cjenovno agresivnog kineskog open‑weight modela uvodi treći pol. Države, telekomi ili banke u regiji sada mogu barem teoretski razmatrati kinesku tehnologiju kao alternativu, ili je koristiti kao polugu u pregovorima s američkim dobavljačima.
Percepcija rizika: Tu dolazimo do neugodne strane priče. DeepSeek je već optužen da je kopirao dijelove modela OpenAI‑a i Anthropica, a američka vlada javno proziva Kinu za industrijsku krađu IP‑ja u AI‑ju. U EU, uključujući Hrvatsku, na snagu stupa Uredba o umjetnoj inteligenciji (EU AI Act) koja posebno naglašava sljedivost, zaštitu podataka i upravljanje rizicima kod temeljnih modela. To znači da korištenje DeepSeek V4 u bankarstvu, zdravstvu ili državnoj upravi neće biti samo tehničko pitanje, nego i regulatorni i politički problem.
Kratkoročni gubitnici su vlasnički »srednje jaki« modeli koji naplaćuju visoku cijenu bez jasne prednosti. Pobjednici su developeri i tvrtke koje uspiju iskoristiti konkurenciju među modelima kako bi smanjili troškove, a zadržali kvalitetu.
3. Šira slika
DeepSeek V4 uklapa se u nekoliko većih trendova u industriji.
1. Dominacija mixture‑of‑experts arhitekture. MoE pristup, u kojem se pri svakom pozivu aktivira samo dio modela, postao je de facto standard za najveće modele. OpenAI, Google i drugi već koriste slične tehnike. DeepSeek ide do kraja: bilijunski broj parametara, ali samo desetci milijardi aktivnih. To prebacuje teret s operativnih troškova (računanje) na kapitalske (infrastruktura). Mali laboratoriji to teško mogu pratiti.
2. Kontekst kao glavno bojno polje. Milijun tokena konteksta omogućuje slučajeve uporabe koji su donedavno bili nepraktični: analiza cijelog monolitnog koda bankarskog sustava, cjelovita revizija ugovorne dokumentacije ili rad s potpunim povijesnim podacima klijenta u jednom upitu. Američki modeli su prvi probili tu granicu; DeepSeek sada pokazuje da se ista funkcionalnost može ponuditi po nižoj cijeni, čime »dugi kontekst« postaje očekivani standard.
3. Zamućivanje razlike između otvorenog i frontier. Do sada je vrijedilo pravilo: otvoreni ili open‑weight modeli kasne barem jednu generaciju za najboljim zatvorenim sustavima. Ako se DeepSeekove tvrdnje o zaostatku od 3–6 mjeseci pokažu točnima, to pravilo pada u vodu. Za mnoge poslovne primjene takav vremenski zaostatak je prihvatljiv ako zauzvrat dobijete niže troškove i mogućnost samostalnog hostanja modela.
Za razliku od američkih konkurenata koji guraju spektakularne multimodalne demo‑prikaze, DeepSeek igra »radničku« igru: tekst, kod, benchmark i cijena. U kontekstu gdje mnoge tvrtke u regiji još uvijek rješavaju osnovnu automatizaciju procesa, to je zapravo vrlo racionalna strategija.
4. Europski i regionalni kut
Hrvatska je dio EU‑a i time i dijela tržišta na koje se izravno primjenjuju GDPR, DSA i uskoro AI Act. To znači da svaka ozbiljna uporaba temeljnih modela, pogotovo ne‑europskih, ulazi u zonu pojačanog nadzora.
Za hrvatske banke, osiguravatelje, zdravstvene ustanove ili državnu upravu korištenje DeepSeek V4 kao glavnog modela za rad s osobnim podacima trenutačno je teško zamislivo. Previše je nepoznanica oko izvora podataka za treniranje i upravljanja rizicima. Vjerojatniji scenarij je da se V4 u skorije vrijeme testira u ograničenim, izoliranim okruženjima – primjerice za interne alate za programere ili analizu neinficiranih javnih dokumenata.
Za startupove i srednje tvrtke priča je drukčija. Njima je cijena često presudni faktor. DeepSeek V4 može omogućiti da tim u Zagrebu ili Splitu dobije performanse bliske vrhu po znatno nižem trošku od korištenja GPT‑5.x. Istodobno se u Europi razvijaju i vlastite alternative – od nacionalnih inicijativa do paneuropskih konzorcija – ali one zasad rijetko pariraju cijenom i skalom.
Na regionalnoj razini (SEE) DeepSeek bi mogao postati moćno oružje za lokalne cloud‑ponuđače, koji bi mogli pakirati V4 kao dio multi‑model ponude, hostane u EU podatkovnim centrima i obogaćene lokalnim mehanizmima nadzora i logiranja. Time bi se dio regulatornog rizika ublažio, iako izvori modela ostaju izvan EU‑pravne sfere.
5. Pogled unaprijed
Što možemo očekivati u sljedećih 12–24 mjeseca?
1. Pad cijena i odgovor američkih igrača. DeepSeek je postavio novu donju granicu cijena. OpenAI, Google i Anthropic teško će ignorirati konkurenciju koja nudi slične mogućnosti znatno jeftinije. Vjerojatno ćemo vidjeti nove »budget« modele, povoljnije paketne ponude i možda regionalno prilagođene tarife, uključujući za EU i SEE.
2. Pojačanu regulativnu filtraciju u EU. AI Act će staviti dodatni fokus na sljedivost podataka za treniranje i transparentnost temeljnih modela. Regulatori i javni naručitelji mogli bi početi eksplicitno tražiti informacije o podrijetlu znanja ugrađenog u model. U toj igri DeepSeek kreće s minusom zbog postojećih optužbi.
3. Selektivnu adopciju u regiji. Startupovi, fakulteti i istraživački instituti u Hrvatskoj i susjednim zemljama vjerojatno će među prvima eksperimentirati s V4. Veliki sustavi s visokom regulacijom – banke, energetske kompanije, javni sektor – kretat će se puno opreznije, prateći razvoj političke i pravne situacije.
Ključno pitanje je može li DeepSeek dugoročno financirati i održavati tempo razvoja koji ga drži svega nekoliko mjeseci iza frontier modela, bez daljnjeg pojačavanja političkog pritiska i mogućih ograničenja izvoza ključnog hardvera.
6. Zaključak
DeepSeek V4 jasno pokazuje da vrhunska umjetna inteligencija više nije isključivo američki teren. Za hrvatske i regionalne korisnike to znači dosad neviđenu kombinaciju snage i niske cijene – ali upakiranu u politički osjetljiv kineski proizvod. U sljedećih godinu‑dvije svaka će ozbiljna organizacija morati odgovoriti na pitanje: koliko nam zaista vrijedi ušteda na tokenima u odnosu na dodatni regulatorni, sigurnosni i geopolitički rizik?



