1. Naslov i uvod
Najzanimljivija europska strategija za umjetnu inteligenciju možda nije utrka za najvećim modelom, nego za najmanjim koji je još uvijek dovoljno dobar. Baskijski “soonicorn” Multiverse Computing upravo tu gradi svoju poziciju: komprimirani, jeftiniji modeli umjesto čistog parametarskog natjecanja. Njihov novi HyperNova 60B na Hugging Faceu nije samo još jedan model, već poruka kako se Europa namjerava nositi s američkim divovima.
U nastavku analiziram što je Multiverse stvarno objavio, zašto je kompresija strateški važna, kako se to uklapa u europsku priču o digitalnom suverenitetu te što to može značiti za Hrvatsku i širu regiju jugoistočne Europe.
2. Vijest ukratko
Kako piše TechCrunch, španjolski startup Multiverse Computing objavio je novu, besplatnu verziju svog komprimiranog velikog jezičnog modela HyperNova 60B na platformi Hugging Face. Model nastaje primjenom njihove kvantno‑inspirirane tehnologije kompresije CompactifAI na OpenAI-jev osnovni model gpt-oss-120b.
HyperNova 60B zauzima otprilike 32 GB memorije, što je oko polovica veličine izvornog modela, a prema tvrdnjama tvrtke zadržava većinu preciznosti i mogućnosti. Ažurirana verzija, HyperNova 60B 2602, posebno je optimizirana za pozivanje alata (tool calling) i tzv. agentsko programiranje, gdje troškovi inferencije vrlo brzo rastu.
Multiverse navodi da HyperNova 60B na pojedinim testovima nadmašuje i konkurentske modele, među njima Mistral Large 3 francuske tvrtke Mistral AI. Prema TechCrunchu, tvrtka već surađuje s klijentima poput Iberdrole, Boscha i Bank of Canada, te je u pregovorima o novoj investicijskoj rundi od oko 500 milijuna eura uz vrednovanje iznad 1,5 milijardi.
3. Zašto je to važno: prava prepreka nisu parametri, nego računi
Poslovni korisnici u teoriji žele “najbolji mogući model”. U praksi ih ograničavaju budžet, latencija i regulativa. Upravo na tu stvarnost cilja Multiverse.
Stisnuti modeli poput HyperNove 60B rješavaju tri ključna problema:
Trošak inferencije – GPU resursi u oblaku su skupi, a glavnina troška AI‑a seli se iz eksperimentiranja u stalni produkcijski rad. Prepolovljena memorijska potrošnja znači manje GPU‑a, bolju iskorištenost postojeće opreme i manje prevelikog dimenzioniranja.
Latencija i korisničko iskustvo – Manji, optimizirani modeli mogu odgovarati brže i uz manje resursa. Kod agentskog koda i lanaca alata svaka dodana sekunda kvari iskustvo i povećava troškove.
Mogućnost lokalne instalacije – Model od 32 GB odjednom realno stane u podatkovni centar banke, osiguravatelja, energetike ili javne uprave. Za organizacije koje ne žele da podaci napuštaju njihovu infrastrukturu, to je presudno.
Potencijalni dobitnici su:
- Tvrtke kojima trebaju ozbiljne AI‑mogućnosti, ali ne i računi na razini OpenAI‑ja.
- Europske i nacionalne institucije koje traže “dovoljno dobre” modele pod vlastitom kontrolom.
- Otvorena zajednica i istraživači, koji dobivaju jak, besplatan referentni model.
Tko može izgubiti? Pružatelji zatvorenih, skupih API‑ja, čiji poslovni model računa na to da će korisnici prihvatiti visoke cijene i vendor lock‑in, te svi koji vjeruju da je sama veličina modela dugoročna zaštita od konkurencije. Multiverse tvrdi suprotno: pravi rov bit će učinkovitost i suverenost, a ne samo broj parametara.
4. Šira slika: od “veće je bolje” do “bolje je da radi u produkciji”
HyperNova 60B uklapa se u nekoliko važnih trendova u industriji.
Prvo, sazrijevanje kompresije modela. Kvantizacija, pruning i distilacija znanja više nisu akademske igre, već standardni alati. Meta s Llamom i open‑source zajednica već dugo pokazuju da se modeli mogu značajno smanjiti bez katastrofalnog pada kvalitete. Multiverse pokušava taj pristup komercijalizirati i prodati kao proizvod.
Drugo, pojavljuje se druga liga modela: ne nužno najjačih na svijetu, nego onih koje je najlakše prilagoditi i implementirati. OpenAI i slični nude frontier‑modele kroz API‑je. Paralelno raste ekosustav “dovoljno dobrih” modela koje možete sami hostati, finije podešavati i vezati za vlastite podatke. HyperNova se jasno pozicionira u toj skupini.
Treće, ponavlja se obrazac iz svijeta clouda. U početku je važilo tko ima najviše servera; kasnije je novac zarađivao onaj tko je omogućio da se s manje resursa napravi više. U AI‑u je vjerojatno pred nama ista tranzicija: dok frontier laboratoriji ruše rekorde, najveća dodana vrijednost bit će u optimizaciji i upravljanju troškovima.
Poseban je i politički aspekt: Multiverse se predstavlja kao dobavljač “suverenih rješenja”, iako u ovom slučaju polazi od OpenAI‑jevog modela. To je pragmatična, ali dvosmislena pozicija – Europa dobiva modele koji se mogu pokretati na vlastitoj infrastrukturi, ali temeljni istraživački rad i dalje dolazi iz SAD‑a.
Ipak, smjer je jasan: fokus prelazi s pitanja “tko ima najveći model?” na “tko omogućava najširem krugu organizacija da modele stvarno koriste, uz prihvatljive troškove i u skladu s propisima?”. Upravo u tom prostoru Europa – i igrači poput Multiversea – imaju šansu.
5. Europski i regionalni kut: što to znači za Hrvatsku i SEE
Za EU je ključna tema digitalni suverenitet, uz istovremeno stroge regulative (GDPR, Uredba o AI‑u, DSA, DMA) i ograničene javne budžete. Multiverseov pristup – kompaktniji modeli koji se mogu vrtjeti na europskoj infrastrukturi – odgovara toj stvarnosti.
Za Hrvatsku i regiju jugoistočne Europe posebno su zanimljivi sljedeći aspekti:
Javni sektor i EU fondovi – Vlade i županije već traže AI‑projekte koje mogu sufinancirati iz EU fondova, ali uz strogu kontrolu podataka. Modeli koji mogu raditi u državnim ili lokalnim podatkovnim centrima ovdje imaju jasnu prednost.
Financijski i energetski sektor – Banke, osiguravatelji, HEP, operatori mreža i telekoma imaju vrlo osjetljive podatke i regulativne zahtjeve. Stisnuti, dovoljno moćan model koji se može vrtjeti unutar njihovih sustava realna je alternativa potpunoj ovisnosti o američkim API‑jima.
Startupi iz Zagreba, Ljubljane, Beograda… – Mnoge mlade tvrtke u regiji grade rješenja iznad otvorenih ili komercijalnih modela. Dostupnost kvalitetnog, besplatnog, relativno “lakog” modela daje im dodatnu opciju, pogotovo ako ciljaju na B2B i regulirane industrije.
Kulturološki, tržišta u EU i u balkanskoj regiji tradicionalno su opreznija prema privatnosti i koncentraciji moći. Transparentan model, kojeg se može samostalno hostati ili barem držati unutar europskog pravnog okvira, često će biti politički lakše obraniti pred upravom, regulatorom ili sindikatima.
6. Pogled unaprijed: što će odlučiti uspjeh Multiversea
Sljedećih 12–24 mjeseca pokazat će hoće li Multiverse postati ključni sloj europske AI‑infrastrukture ili ostati zanimljiva niša.
Na što vrijedi obratiti pozornost:
Neovisni benchmarki i stvarni troškovi – Tvrdnje o nadmoći nad Mistral Large 3 zvuče dobro, ali banke i industrija tražit će dokaze na konkretnim zadacima (kod, RAG, višejezično rezoniranje) i jasnu računicu TCO‑a.
Širina portfelja – TechCrunch spominje planove za dodatne komprimirane modele u 2026. Ključno je hoće li Multiverse postati platforma za kompresiju različitih osnovnih modela ili ostati vezan uz uzak skup tehnologija.
Pakiranje usklađenosti (compliance) – S primjenom Uredbe o AI‑u, tražit će se rješenja koja dolaze s ugrađenim logiranjem, dokumentacijom i alatima za procjenu rizika. Ako Multiverse to ponudi uz modele, regulativa mu može postati konkurentska prednost.
Struktura nove investicije – Runda od 500 milijuna eura dignula bi tvrtku u rang Mistrala. Bit će zanimljivo vidjeti tko ulaže i koliko će europski javni ili strateški kapital imati utjecaja u odnosu na globalne fondove rizičnog kapitala.
Edge i industrijski use caseovi – Model od 32 GB još uvijek nije za mobitel, ali je vrlo zanimljiv za pametne tvornice, energetsku infrastrukturu, mrežu baznih stanica ili promet. Ako Multiverse tu osigura nekoliko referentnih implementacija, može se čvrsto ugraditi u industrijski ekosustav.
Glavno je pitanje hoće li razvoj frontier‑modela (kvaliteta) ići brže od napretka kompresije (učinkovitost). Ako da, Multiverse bi mogao stalno “loviti” pokretnu metu. Njihova je oklada da će za većinu poslovnih slučajeva cijena, lokacija podataka i usklađenost značiti više od zadnjih nekoliko postotaka performansi na apstraktnim testovima.
7. Zaključak
Besplatno izdanje HyperNove 60B nije samo potez za vidljivost, već jasna poruka: europska šansa u umjetnoj inteligenciji vjerojatno leži u učinkovitoj i suverenoj upotrebi, a ne u tome da trošimo najviše na najveće modele. Ako je Multiverse u pravu, najvažnije AI tvrtke ovog desetljeća neće nužno biti one s najvećim GPU klasterima, nego one koje omogućuju bankama, industriji i javnom sektoru da AI koriste održivo i pod vlastitim uvjetima. Ključno pitanje za hrvatske i regionalne tvrtke glasi: optimizirate li danas za maksimalnu snagu modela – ili za trošak, kontrolu i usklađenost koje ćete moći braniti i 2028. godine?



