DeepSeek V4: Kitajski cenovni šok, ki pritiska na ameriške AI gigante

DeepSeek z novo generacijo modelov V4 ne tekmuje več le v raziskavah, temveč neposredno v poslu. Mešanica izjemno velikih modelov, milijonskega konteksta in agresivno nizkih cen postavlja pod vprašaj celotno ekonomiko generativne umetne inteligence. Za evropske – in slovenske – razvijalce to pomeni mamljivo alternativo dragim ameriškim API‑jem, hkrati pa nov paket vprašanj o zanesljivosti, skladnosti in geopolitičnem tveganju. V nadaljevanju razčlenjujem, kaj pravzaprav DeepSeek ponuja, zakaj bi moralo to zanimati tudi podjetja v Ljubljani in Mariboru ter kako se bo ta poteza verjetno poznala na računih za oblak.

1. Novica na kratko

Kot poroča TechCrunch, je kitajski laboratorij DeepSeek objavil predogled dveh različic nove družine velikih jezikovnih modelov DeepSeek V4: V4 Flash in V4 Pro. Oba uporabljata arhitekturo mixture‑of‑experts (MoE) in podpirata kontekstna okna do 1 milijona tokenov, kar omogoča analizo celotnih kodnih baz ali velikih zbirk dokumentov v enem pozivu.

Model V4 Pro ima skupno približno 1,6 bilijona parametrov, pri čemer je pri posamezni poizvedbi aktivnih 49 milijard. To ga po navedbah DeepSeeka uvršča med največje javno dostopne open‑weight modele. Manjši V4 Flash ima okoli 284 milijard parametrov, z 13 milijardami aktivnih. V primerjavi s prejšnjim V3.2 naj bi oba pomembno napredovala pri sklepanju in programiranju ter se na določenih testih približala ali celo prehitela zaprte modele ameriških velikanov.

Za zdaj gre zgolj za besedilne modele – brez obdelave slik, zvoka ali videa. Njihova glavna prednost je cena: stroški tokenskega vnosa in iznosa so nižji kot pri primerljivih modelih OpenAI (GPT‑5.x), Googla (Gemini 3.x) in Anthropica (Claude 4.x). Izdaja pride le dan po tem, ko so ZDA javno obtožile Kitajsko obsežnega kraje IP na področju umetne inteligence; DeepSeek so posamično že prej kritizirali zaradi domnevnega »destiliranja« modelov konkurentov.

2. Zakaj je to pomembno

DeepSeek V4 je pomemben iz treh vidikov: stroškov, strateške avtonomije in dinamike odprtih uteži.

Stroški: Cene, ki jih navaja TechCrunch, niso kozmetični popust, temveč neposreden napad na obstoječe tarife. Za vsako podjetje, ki uporablja RAG, analizo kode ali obdelavo velikih dokumentnih zbirk, je ključna postavka cena vhodnih tokenov. Če DeepSeek v praksi res dosega kakovost, ki je le nekaj mesecev za najboljšimi modeli OpenAI, je prihranek nekaj deset odstotkov pri tokenih preprosto preveč privlačen, da bi ga lahko ignorirali.

Strateška avtonomija: Evropski odločevalci veliko govorijo o digitalni suverenosti, realnost pa je, da večina naprednih AI‑storitev teče na ameriških oblakih z ameriškimi modeli. Kitajski open‑weight model z visokim stropom zmogljivosti in nizko ceno daje evropskim podjetjem vsaj neko pogajalsko izhodišče – in v določenih primerih tudi realno alternativo. Še posebej to velja za države in sektorje, ki ne želijo biti popolnoma odvisni od enega teknološkega bloka.

Odprte uteži in zaupanje: DeepSeek sicer ni odprtokoden v klasičnem smislu, vendar javna objava uteži v tem obsegu spremeni ravnotežje moči. Raziskovalni inštituti, ponudniki oblaka ali večja podjetja lahko model prilagodijo in poganjajo pod lastnim nadzorom, brez pošiljanja vseh podatkov v ZDA. Vendar istočasno nad modelom visi oblak obtožb: tako ameriška vlada kot nekateri ponudniki (Anthropic, OpenAI) DeepSeek povezujejo z nepooblaščenim prevzemom znanja. Za vsakega DPO-ja ali CISO-ja v EU to pomeni dodatno regulatorno tveganje.

Takojšen poraženec so srednje zmogljivi zaprti modeli s slabšim razmerjem med ceno in kakovostjo. Zmagovalci pa so razvijalci in podjetja, ki bodo znala izkoristiti konkurenco med modeli in stroške znižati brez večjih žrtev pri kakovosti.

3. Širši kontekst

DeepSeek V4 se lepo vklaplja v tri večje trende v generativni umetni inteligenci.

1. Uveljavitev arhitekture MoE. Mešanica ekspertov je še pred nekaj leti delovala eksotično; danes velja za skoraj nujen pristop pri zelo velikih modelih. S tem pristopom se v posamezni poizvedbi aktivira le del parametrov, kar zmanjša stroške računanja. DeepSeek je pripravljen plačati visoko investicijo v shranjevanje ogromnih mrež, da lahko potem uporabnikom ponudi nizke tekoče stroške – to je agresiven finančni inženiring, ki ga manjši laboratoriji težko posnemajo.

2. Kontekst kot novo bojišče. Milijonsko kontekstno okno odpre primere rabe, ki so bili prej kljub AI skoraj neizvedljivi: analiza celotnih monorepozitorijev, kompleksnih pravnih arhivov ali dolgih tehničnih standardov v enem koraku. Prvi so daljši kontekst ponudili ameriški ponudniki; dejstvo, da ga sedaj kitajski model ponuja po bistveno nižji ceni, bo dolg kontekst spremenilo iz prestižne lastnosti v zgolj osnovno zahtevo.

3. Razlika med odprtim in »frontier« se manjša. Družina Llama je pokazala, kako močno lahko dobro zasnovan open‑weight model pretrese ekosistem. Toda Llama je bil večinoma pol koraka za najboljšimi zaprtimi modeli. Če DeepSeek res drži obljubo o zaostanku le nekaj mesecev za čisto »špico«, smo na poti v svet, kjer odprto‑utežni modeli niso več generacijo zadaj, ampak skoraj v korak. To zmanjšuje manevrski prostor za zaprte ponudnike in daje večjo težo lokalnim namestitvam.

DeepSeek se zavestno odreka bleščečim multimodalnim demonstracijam in stavi na najboljše razmerje med ceno in kakovostjo pri tekstu in kodi. To je v resnici precej evropska logika – uporabnost pred spektaklom.

4. Evropski in slovenski vidik

Za evropske uporabnike je DeepSeek V4 skušnjava in opozorilni znak hkrati.

Cenovna prednost je očitna. Za slovenska podjetja, ki gradijo notranje pomočnike, avtomatizacijo procesov ali orodja za razvijalce, pomeni možnost milijonskega konteksta po relativno nizki ceni precejšen preskok. Še posebej za startup scene v Ljubljani, Mariboru in Celju, kjer vsak evro za oblak šteje, je tak model zelo privlačen.

Toda regulativno okolje EU narekuje previdnost. Uredba o AI (EU AI Act) uvaja stroge zahteve glede upravljanja tveganj, transparentnosti in nadzora nad ključnimi modeli. GDPR dodatno omejuje, komu lahko zaupate osebne podatke. Če k temu dodamo politični kontekst obtožb o kraji intelektualne lastnine, je jasno, da bo neposredna uporaba DeepSeeka v bančništvu, zdravstvu ali javni upravi izjemno občutljiva.

Verjetnejši scenarij za Slovenijo je, da bo nekaj ponudnikov oblaka in raziskovalnih skupin (denimo na UL ali UM) testno uvajalo V4 v lastnih, zaprtih okoljih, morda brez občutljivih podatkov. S tem bodo pridobili izkušnje in primerjave z modeli iz ZDA in Evrope (npr. odprti modeli, ki nastajajo v okviru evropskih konzorcijev).

Hkrati DeepSeek predstavlja hladno prho za evropske »suverene« modele, ki nastajajo s podporo javnih sredstev. Če lahko kitajski laboratorij vsaj približno ujame »špico« po bistveno nižji ceni, se bo morala EU iskreno vprašati, ali vlaga dovolj – in dovolj pametno – glede na globalno konkurenco.

5. Pogled naprej

V naslednjih 1–2 letih lahko pričakujemo nekaj jasnih premikov.

1. Cenovna vojna med modeli. DeepSeek je nastavil novo referenčno točko. Ameriški ponudniki bodo skoraj prisiljeni znižati cene ali ponuditi agresivne »budget« različice, da ohranijo delež na trgu. Dobički pri osnovnih modelih se bodo manjšali, več vrednosti pa se bo selilo v orodja za orkestracijo, varnost, nadzor in vertikalne rešitve.

2. Strožji nabavni postopki. V Evropi bo DeepSeek verjetno eden prvih primerov, kjer bodo naročniki v javnem in finančnem sektorju testirali, kako daleč lahko gredo z neevropskimi modeli, ki imajo nejasen izvor podatkov. V razpisih se bodo začele pojavljati klavzule o sledljivosti učnih podatkov, spoštovanju avtorskih pravic in kibernetski varnosti – kar bo za DeepSeek trši oreh kot gola zmogljivost.

3. Plastovit trg. Manjši razvijalci in startupi – tudi v Sloveniji – bodo DeepSeek verjetno hitreje posvojili, ker lovijo predvsem nizke stroške in fleksibilnost. Veliki sistemi s tisoči zaposlenih in strogo regulacijo pa bodo ostali previdni in uporabljali V4 morda le v zalednih ali raziskovalnih okoljih.

Ključno odprto vprašanje je, ali lahko DeepSeek dolgoročno vzdržuje tempo razvoja, ki je »le« nekaj mesecev za največjimi igralci. To zahteva ogromne kapitalske vložke in zrelost pri upravljanju tveganj, ki je pri hitro rastočih kitajskih podjetjih vse prej kot samoumevna.

6. Spodnja črta

DeepSeek V4 je opomnik, da vrhunska umetna inteligenca ni več izključno ameriško igrišče. Za evropske in slovenske uporabnike prinaša kombinacijo izjemno privlačne cene in politično občutljivega izvora. V kratkem bo moral vsak CTO in CISO odgovoriti na vprašanje: ali je prihranek pri tokenih vreden dodatnega regulatornega in geopolitičnega tveganja – ter kako se pri teh odločitvah sploh definira digitalna suverenost?

DeepSeek V4: Kitajski cenovni šok, ki pritiska na ameriške AI gigante