Naslov in uvod
Oblačni GPU‑ji so bili gorivo trenutnega razcveta generativne umetne inteligence – in to gorivo je že danes predrago. Če se bo kaj resno spremenilo, to ne bo zato, ker bi modeli čudežno postali majhni, temveč zato, ker se bo vedno več dela neopazno preselilo na naše prenosnike in telefone. Londonski Mirai, za katerim stojita ustanovitelja aplikacij Prisma in Reface, je stava prav na ta premik. V nadaljevanju pogledamo onkraj zneska investicije: lahko 14‑članska ekipa dejansko spremeni ekonomiko genAI in kaj to pomeni za razvijalce, ponudnike oblaka ter evropski tech?
Novica na kratko
Kot poroča TechCrunch, je Mirai londonski startup, ki gradi pogon za izvajanje AI modelov neposredno na uporabniški napravi, za začetek na računalnikih z Apple Silicon. Podjetje sta leta 2025 ustanovila Dima Shvets, soustanovitelj aplikacije za zamenjavo obrazov Reface, in Alexey Moiseenkov, soustanovitelj ter nekdanji direktor viralne aplikacije Prisma.
Mirai je zbral 10 milijonov dolarjev semenskega kapitala v rundi, ki jo je vodil sklad Uncork Capital, sodeluje pa tudi več znanih poslovnih angelov iz okolja Snowflake, ElevenLabs, Coinbase in drugod. Tehnična ekipa, ki šteje 14 ljudi, je zgradila pogon v jeziku Rust; po lastnih meritvah lahko na Applovi strojni opremi pohitri generiranje modela do 37 odstotkov, in to brez spreminjanja uteži modela. Trenutni fokus sta besedilo in govor, podpora za sliko je načrtovana.
Podjetje pripravlja SDK, ki naj bi razvijalcem omogočal integracijo Miraijevega okolja z nekaj vrsticami kode. Vzporedno sodeluje z razvijalci modelov in proizvajalci čipov pri prilagajanju modelov za robno izvajanje, načrtuje prehod na Android ter razvija orkestracijski sloj, ki preusmeri zahteve v oblak, kadar naprava naloge ne zmore lokalno.
Zakaj je to pomembno
Ne preveč privlačna resnica večine današnjih AI izdelkov je, da imajo zelo slabo enotočno ekonomiko. Največji strošek ni učenje, temveč izvajanje modelov pri rasti števila uporabnikov. Klepetalni pomočnik, ki se uporabniku zdi brezplačen, lahko v ozadju porabi več deset centov na sejo v oblaku. Dokler teče tvegan kapital, je to vzdržno; ko pridejo na vrsto marže, postane problem.
Mirai napada prav ta del težave: čim več izvajanja prenesti na strojno opremo, ki jo uporabnik že ima. Če lahko prenosnik z Apple Silicon lokalno poganja dovolj zmogljiv jezikovni ali govorni model, se mejni strošek posamezne poizvedbe približa ničli. Vrednost se premakne iz podatkovnega centra k runtime plasti, ki iz vsakega vata na napravi iztisne največjo možno prepustnost.
Za razvijalce je obljuba dvojna. Prvič, boljše marže in manjša odvisnost od hiperskalnih oblakov. Drugič, poenostavljena integracija: Mirai želi postati nekakšen Stripe za on‑device AI, ki za knjižnico SDK skrije optimizacije kernela, izbiro kvantizacije in posebnosti naprav. Če jim uspe, bodo lahko tudi manjše ekipe dostavile pomočnike, orodja za prepis ali prevajanje, ki delujejo skoraj v realnem času – brez pogajanj za GPU kapacitete.
Na drugi strani potencialno izgubljajo ponudniki oblaka in proizvajalci zmogljivih čipov, ki danes zaračunavajo praktično vsak generiran token. Seveda bodo še naprej ključni za težke delovne obremenitve in učenje modelov, toda če se na rob preseli tudi samo 20 do 30 odstotkov izvajanja, je učinek že občuten. Obenem se nekoliko kruši zaprtost ekosistemov Appla, Googla, Qualcomma in drugih, ki vsi gradijo lastne sklade za lokalno AI obdelavo.
Širša slika
Mirai ni izumil lokalnega izvajanja modelov; poskuša ga profesionalizirati in narediti splošno uporabnega. Veliki igralci so koncept že validirali. Apple uporablja svoj Neural Engine za fotografske učinke in lokalno razpoznavo govora. Google že dolgo poganja translacijske in napovedne modele neposredno na telefonih. Tudi tipkovnice na Androidu s seboj nosijo kompaktne jezikovne modele.
Spremenilo pa se je razmerje med pričakovanji uporabnikov in velikostjo modelov. Ljudje danes od asistenta pričakujejo izkušnjo, primerljivo z oblačnimi sistemi. Istočasno je trg spoznal, kako krhka je ekonomika, če se vse izvaja zgolj v oblaku. Zato je neodvisna plast za robno izvajanje naenkrat zanimiva, zlasti za razvijalce, ki se nočejo popolnoma vezati na enega samega ponudnika platforme.
Tu je tudi zgodovinski odmev. Pred približno desetletjem je že obstajal val startupov, ki so optimizirali modele za mobilne in IoT čipe. Večina je bila prezgodaj: modeli so bili majhni, uporabna vrednost nejasna, oblak pa poceni. Kot je za TechCrunch poudaril eden od vlagateljev, so ta podjetja pogosto končala v tihih prevzemih zaradi kadrov in nišnih tehnologij. Danes je kontekst drugačen: modeli so mnogokrat večji, povpraševanje uporabnikov jasno, ozko grlo pa je zmogljivost GPU.
V primerjavi z današnjimi velikimi ponudniki Mirai ne bo poseben zato, ker zna modele pognati na napravi – to znajo še drugi – temveč če mu uspe postati privzeti vmesnik za razvijalce. Podobno, kot je Stripe za plačila ali Twilio za sporočila. Za kaj takega bo moral biti Mirai izjemno pragmatičen: podpirati tiste modele in čipe, ki razvijalce dejansko zanimajo, ponuditi vrhunska orodja in benchmarke ter se sprijazniti, da je orkestracija med robom in oblakom del osnovnega produkta, ne dodatek.
Evropski in slovenski vidik
Za Evropo lokalno izvajanje AI ni samo vprašanje stroškov, temveč tudi regulative in digitalne suverenosti. GDPR spodbuja načelo minimizacije podatkov in lokalne obdelave. Prihajajoči evropski Akt o umetni inteligenci z oceno tveganja bo še dodatno poudaril, kje in kako se obdelujejo občutljivi podatki. Več izvajanja na sami napravi se lepo sklada s tema okviroma: manj osebnih podatkov potuje po omrežju in se shranjuje na strežnikih.
To je relevantno za panoge, kjer ima Evropa – in deloma tudi Slovenija – prednosti: industrijska avtomatizacija, avtomobilska industrija, zdravstvo, fintech, javne storitve. Predstavljajte si bolnišnično aplikacijo, ki prepis posveta zdravnika in pacienta obdela lokalno na tablici, ali mobilno bančništvo, kjer se del preverjanja tveganja izvaja na sami napravi. Takšne arhitekture so pred regulatorji precej lažje zagovarjati, če lahko ponudnik pokaže deterministične performanse in jasne meje podatkovnih tokov.
Za slovenski ekosistem – od mlajših startupov v Ljubljani do podjetij, ki razvijajo nišne industrijske rešitve – je Mirai zanimiv kot potencialno orodje, ki zmanjša strošek eksperimentiranja z AI funkcionalnostmi. Manjša podjetja nimajo budžeta za stotine tisočev evrov na leto za oblačne GPU‑je. Če lahko ključne funkcije poganjajo na napravi uporabnika, je pot do produkta in prihodkov krajša.
Hkrati bi lahko evropski regulatorji v okviru Akta o umetni inteligenci in prenove pravil o kibernetski varnosti začeli bolj eksplicitno spodbujati arhitekture, ki dajejo prednost obdelavi na robu. Mirai in podobni ponudniki bi bili neposredni upravičenci takšnega premika.
Pogled naprej
Uspeh Mirai bo odvisen od nekaj ključnih prelomnic.
Prvič, od razmerij z velikimi platformami. Apple, Google, proizvajalci čipov in celo nekateri ponudniki modelov gradijo lastne knjižnice in orodja za lokalno izvajanje. Mirai bo moral dokazati, da razvijalcem prinese dovolj dodatne vrednosti – v zmogljivosti, enostavnosti ali skladnosti z regulativo – da se splača odvisnost od dodatne plasti.
Drugič, od soočenja z odprtokodnimi rešitvami. Skupnost je v zadnjih letih ustvarila izjemno učinkovita orodja za kvantizacijo in optimizacijo modelov za rob. Mirai stavi na to, da bo mnogo ekip raje plačalo za podprt in dodelan sklad z dobro dokumentacijo, analitiko in orkestracijo, kot da bi vse to gradili sami. Cenovna politika bo tu ključna, zlasti v času, ko startupi in podjetja lovijo vsako evrocent marže.
Tretjič, od hibridne zgodbe. Sam Mirai priznava, da vsega ni smiselno poganjati na napravi. Orkestracijski sloj, ki bo odločal, kaj ostane lokalno in kaj gre v oblak, bo zelo verjetno srce produkta in glavni vir prihodkov. Upoštevati bo moral latenco, zasebnost, zmogljivost naprave, soglasje uporabnika in ceno infrastrukture – to pa je zahtevna kombinacija tehničnih in produktnih odločitev.
V naslednjih 12 do 24 mesecih bo vredno spremljati konkretne benchmarke, prve referenčne stranke in morebitna partnerstva z izdelovalci čipov ali ponudniki modelov. Z vidika Slovenije bo zanimivo videti, ali se bo pojavila kakšna domača aplikacija ali storitev, ki bo Mirai ali podoben sklad uporabila za konkurenčno prednost pri stroških.
Spodnja črta
Mirai je jasna stava na prihodnost, v kateri genAI ni le tanki odjemalec do oblaka, temveč porazdeljena zmožnost, ki teče tam, kjer je to ekonomsko in regulativno najbolj smiselno. Ustanoviteljska izkušnja z viralnimi potrošniškimi aplikacijami in poudarek na razvijalski izkušnji sta dobra izhodišča, toda trg za on‑device runtime rešitve bo brutalen in močno prepleten s politiko platform. Za evropske – in slovenske – razvijalce je ključno vprašanje, kdo bo obvladoval to ključno plast med modeli in napravami v naših žepih.



