Evropska prednost v umetni inteligenci je lahko majhna, ne ogromna: pomen stisnjenega modela Multiverse

1. Naslov in uvod

Najbolj zanimiva evropska strategija za umetno inteligenco morda ni lov za največjim modelom, temveč za najmanjšim še uporabnim. Baski “soonicorn” Multiverse Computing stavi, da bodo za podjetja pomembnejši stisnjeni, cenejši modeli kot laboratorijski frontier-poskusi. Njihov novi model HyperNova 60B na Hugging Face ni le še ena objava, temveč signal, kako želi Evropa tekmovati z ameriškimi velikani.

V nadaljevanju analiziram, kaj je Multiverse dejansko objavil, zakaj je kompresija strateško pomembna, kako se to vklaplja v evropski narativ digitalne suverenosti in kaj to pomeni za prihodnjo AI-infrastrukturo – tudi za Slovenijo.

2. Kaj se je zgodilo (na kratko)

Kot poroča TechCrunch, je španski startup Multiverse Computing objavil novo, brezplačno različico svojega stisnjenega velikega jezikovnega modela HyperNova 60B na platformi Hugging Face. Model nastane z uporabo njihove tehnologije kompresije CompactifAI – ki se navdihuje pri kvantnem računalništvu – na osnovnem modelu OpenAI gpt-oss-120b.

HyperNova 60B po podatkih podjetja zasede približno 32 GB pomnilnika, kar je okoli polovica izvirnega modela, ob tem pa naj bi ohranila večino natančnosti in zmožnosti. Posodobljena izdaja HyperNova 60B 2602 posebej izboljšuje podporo za tool calling in t. i. agentsko programiranje, kjer so stroški inferenc hitro zelo visoki.

Multiverse trdi, da model na nekaterih testih prekaša tudi konkurente, denimo Mistral Large 3 francoskega enoroga Mistral AI. Podjetje ima že vrsto korporativnih strank, med drugim Iberdrola, Bosch in Bank of Canada, ter se po navedbah TechCruncha pogaja o novi naložbi v višini približno 500 milijonov evrov pri vrednotenju nad 1,5 milijarde evrov.

3. Zakaj je to pomembno: ozko grlo niso parametri, ampak proračuni

Na papirju bi skoraj vsako podjetje želelo “frontier” model. V praksi si večina ne more privoščiti njegovega delovanja v produkciji. Ta razkorak med željami in realnimi proračuni je segment, na katerega meri Multiverse.

Stisnjeni modeli, kot je HyperNova 60B, ciljajo na tri kronične bolečine:

Stroški inferenc – Čas na GPU-jih v oblaku je drag. V podjetjih se stroški že selijo iz eksperimentov v produkcijo. Polovična pomnilniška zasedenost ne pomeni le manj računalniške porabe, ampak omogoča tudi boljšo izkoriščenost strojne opreme in manj prekomernega dimenzioniranja.
Latenca in uporabniška izkušnja – Manjši, optimizirani modeli so hitrejši in manj požrešni. Pri agentskem programiranju in veriženju orodij se latenca kopiči; kompresija tu ne pomeni le prihranka, ampak spremeni, kaj je sploh izvedljivo v realnem času.
Možnost samostojne namestitve – Model velikosti 32 GB makes on-premise in celo edge‑namestitve realne tudi za banke, energetiko in javni sektor, kjer podatki ne smejo zapustiti njihovih sistemov.

Zmagovalci tega pristopa so:

Cenovno občutljiva podjetja, ki želijo močne zmožnosti brez cenovne strukture OpenAI.
Evropske javne institucije, ki potrebujejo “dovolj dobre” modele pod lastnim nadzorom.
Odprtokodna in raziskovalna skupnost, ki dobijo brezplačen, zmogljiv referenčni model.

Kdo lahko izgubi? Potencialno ponudniki dragih API-jev, katerih marža temelji na toleranci do visokih računov za inferenco, in vsi, ki stavijo, da bo zgolj velikost modela dolgoročna prednost. Multiverse implicitno trdi, da bo prava konkurenčna prednost učinkovitost + suverenost, ne število parametrov.

4. Širši kontekst: iz “večje je bolje” v “v produkciji je bolje”

HyperNova 60B se umešča v križišče več trendov.

Prvič, zorenje kompresije modelov. Kvantizacija, prirezovanje (pruning) in destilacija znanja so iz akademske niše postali ključni del AI-infrastrukture. Meta z družino Llama in odprtokodne skupnosti intenzivno krčijo modele brez dramatične izgube kakovosti. Multiverse poskuša ta proces industralizirati kot izdelek s kvantno navdahnjenim “twistom”.

Drugič, vidimo vzpon specializiranih implementacijskih modelov. OpenAI, Anthropic in drugi ponujajo splošnonamenske frontier-modele kot storitev. Vzporedno pa nastaja ekosistem “dovolj dobrih” modelov, ki jih je lažje prilagoditi, samostojno poganjati ali vgraditi v obstoječe sisteme. HyperNova je v tem drugem taboru, bližje manjšim modelom Mistrala ali skladom okoli Llama, kot pa hipotetičnemu GPT‑5.

Tretjič, dogaja se ponovitev zgodbe računalništva v oblaku. Sprva je šlo za gole teraflopse; kasneje je največ zaslužil tisti, ki je optimiziral stroške in izkoriščenost (od AWS Graviton do Databricks). Pri AI smo na podobni poti: frontier privlači pozornost, pravo poslovanje pa bo v optimizaciji, orkestraciji in seveda kompresiji.

V primerjavi s tekmeci se Multiverse ne pozicionira kot “evropski OpenAI” po velikosti modelov, ampak kot plast učinkovitosti na vrhu frontier-raziskav, tudi ameriških. To je pametna, a politično občutljiva drža: prodajajo “suverene rešitve”, ki so deloma zgrajene na ameriških osnovnih modelih.

Smer razvoja je vseeno jasna: fokus se premika od vprašanja “kdo ima največji osnovni model?” k vprašanju “kdo omogoča, da podjetja AI ekonomsko in skladno z regulativo dejansko uporabljajo?”. Po tej osi je Multiverse zgodnji igralec – a ne edini.

5. Evropski in slovenski vidik: suverenost skozi učinkovitost

Evropski odločevalci veliko govorijo o digitalni suverenosti, a realnost je, da EU težko finančno tekmuje z ZDA ali Kitajsko v goli velikosti AI-modelov. Pristop Multiverse je zanimiv prav zato, ker to omejitev sprejme in jo obrne v strategijo.

S kompresijo in pakiranjem modelov v obliko, ki ustreza evropski infrastrukturi in regulativi, podjetje gradi most med Brusljem in Baskijo, namesto da bi skušalo posnemati Silicijevo dolino.

Za Evropo in tudi Slovenijo je pomembno več vidikov:

Usklajenost z Uredbo o umetni inteligenci (EU AI Act) – Manjši, obvladljivejši modeli so lažje dokumentirani, nadzorovani in vključeni v oceno tveganja. Za visoko tvegane sektorje (bančništvo, energetika, zdravstvo) je možnost samostojne namestitve velika prednost.
Javni sektor in regije – Primer sodelovanja z Aragonijo in špansko agencijo SETT kaže, kako se lahko tudi slovenske regije ali država lotijo projektov “suverenega AI”. Sredstva EU, npr. iz programa Digitalna Evropa, se lahko usmerijo v takšne modele, ne le v infrastrukturo.
Industrijska podjetja – Slovenska energetika, logistika, proizvodnja (denimo ekosistem okoli Gorenja, Krke, Revoza) imajo podobne potrebe kot Iberdrola ali Bosch: AI blizu podatkom, pogosto na lastni infrastrukturi.

Kulturno gledano so evropske in slovenske uprave bolj konzervativne glede zasebnosti in tveganj. Pregleden, odprt in stroškovno obvladljiv model ima tu precej več možnosti kot črna skrinjica iz ZDA, četudi je ta nekoliko zmogljivejša.

6. Pogled naprej: kaj bo odločilo, ali bo Multiverse resničen “unicorn”

Naslednjih 12–24 mesecev bo pokazalo, ali je Multiverse zmožen preskoka od nekaj pomembnih strank do platformnega igralca.

Ključna vprašanja, na katera velja biti pozoren:

Neodvisni testi – Podjetja bodo želela ne le marketinških grafov, ampak primerljive teste na konkretnih nalogah: programsko in agentsko delo, večjezični RAG, domensko specifične primere. Skupaj z izračunanim TCO (total cost of ownership).
Širina portfelja stisnjenih modelov – TechCrunch omenja načrte za dodatne odprtokodne izdaje v letu 2026. Bistveno bo, ali se Multiverse razvije v platformo za kompresijo različnih osnovnih modelov ali ostane osredotočen na en sam ekosistem.
Regulativni paket “out of the box” – Z uveljavitvijo EU AI Act bo trg lačen rešitev, ki prinašajo vgrajene funkcije nadzora, logiranja in dokumentacije. Če bo Multiverse to zapakiral skupaj z modeli, lahko regulativa postane njegov konkurenčni jarek.
Financiranje in neodvisnost – Potencialni krog v višini 500 milijonov evrov bi podjetje pomaknil v ligo Mistrala. A pritisk vlagateljev bo velik: od podjetja bodo zahtevali jasno zgodbo rasti – bodisi kot produktna platforma bodisi kot glavni evropski ponudnik “suverenega AI”.
Premik proti robu omrežja (edge) – Modeli velikosti 32 GB še niso za telefone, so pa že zanimivi za tovarne, podatkovne centre operaterjev in večje organizacije. Če bo Multiverse sposoben nadaljnjega krčenja brez velike izgube kakovosti, lahko postane pomemben igralec pri AI v industriji 4.0.

Glavno tveganje je očitno: frontier-modeli se še vedno hitro izboljšujejo. Če bo njihov napredek hitrejši od napredka v kompresiji, se lahko Multiverse znajde v večni lovski igri. Njihova stava je, da bodo ekonomika, regulativa in lokalnost podatkov dolgoročno pomembnejše od nekaj odstotkov razlike v sintetičnih benchmarkih.

7. Ključna misel

Izdaja brezplačnega modela HyperNova 60B ni le poteza za prepoznavnost na Hugging Face, ampak jasen signal: evropska prednost v AI bo najverjetneje učinkovitost in nadzor, ne goli obseg. Če ima Multiverse prav, bodo najpomembnejša AI-podjetja tega desetletja tista, ki drugim omogočajo donosno in suvereno uporabo AI, ne nujno tista z največjo gruče strežnikov. Za slovenska podjetja je ključno vprašanje: ali optimizirate za maksimalno zmogljivost danes ali za stroške, nadzor in skladnost, ki jih boste lahko zagovarjali čez tri leta?

Evropska prednost v umetni inteligenci je lahko majhna, ne ogromna: pomen stisnjenega modela Multiverse

1. Naslov in uvod

2. Kaj se je zgodilo (na kratko)

3. Zakaj je to pomembno: ozko grlo niso parametri, ampak proračuni

4. Širši kontekst: iz “večje je bolje” v “v produkciji je bolje”

5. Evropski in slovenski vidik: suverenost skozi učinkovitost

6. Pogled naprej: kaj bo odločilo, ali bo Multiverse resničen “unicorn”

7. Ključna misel

Komentarji

Pustite komentar

Povezani članki

MatX proti Nvidii: ko 500 milijonov dolarjev meri na računsko moč, ne le na hitrost

Ko šefa zamenja model: kaj pomeni Uberjev »Dara AI« za delo in vodstvo

Spor Anthropic–Pentagon: ko etika umetne inteligence trči ob državno moč

Ostani na tekočem