1. Naslov i uvod
Google je povukao potez koji bi dugoročno mogao biti važniji od još jednog moćnog oblačnog modela: Gemma 4 dolazi s otvorenim težinama i – još važnije – s prijelazom na licencu Apache 2.0. To je jasna poruka da lokalno izvođenje umjetne inteligencije više nije eksperiment nego strategija. Za hrvatske i regionalne tvrtke, od banaka do turističkog sektora i zagrebačkih startupa, to otvara nove opcije kako graditi AI sustave pod vlastitom kontrolom. U nastavku analiziramo zašto je licenca ključ priče, kako se Gemma 4 uklapa u globalnu utrku i što znači za razvoj AI u EU i jugoistočnoj Europi.
2. Vijest ukratko
Prema pisanju Ars Technice, Google je predstavio Gemmu 4, novu generaciju otvorenih AI modela i prvu veliku nadogradnju Gemme nakon otprilike godinu dana. Obitelj se sastoji od četiri modela: dva veća za lokalne servere – 26‑milijardni Mixture of Experts (MoE) i 31‑milijardni gusti model – te dva učinkovita rubna modela Effective 2B (E2B) i Effective 4B (E4B), usmjerena na mobilne uređaje i hardver niske potrošnje.
Veći modeli su dizajnirani da rade ne‑kvantizirani na jednoj Nvidia H100 GPU kartici s 80 GB memorije, a nakon kvantizacije mogu raditi i na potrošačkim GPU‑ovima. E2B i E4B su optimizirani u suradnji s Pixel timom te Qualcommom i MediaTekom za rad na pametnim telefonima te pločama poput Raspberry Pi i Jetson Nano, uz naglasak na malu potrošnju memorije i nisku latenciju.
Najveća novost je licenca: Google napušta vlastitu Gemma licencu i Gemmu 4 objavljuje pod Apache 2.0, permisivnom licencom koju pravnici i developeri dobro poznaju. Modeli su dostupni putem Google AI Studija i AI Edge Galleryja, u Google Cloudu te kao težine za preuzimanje na platformama poput Hugging Facea, Kagglea i Ollame.
3. Zašto je to važno
Ključna promjena nije samo u performansama, već u povjerenju. Prethodna Gemma licenca bila je za mnoge organizacije crvena lampica: široko definirana zabranjena uporaba, mogućnost jednostranih izmjena i nejasnoće oko toga prenose li se ograničenja i na druge modele trenirane na Gemminim sintetičkim podacima. Malo koji pravni odjel u banci ili telekomu želi takav rizik.
Prelaskom na Apache 2.0 Google praktički kaže: možete slobodno ugrađivati Gemmu u svoje proizvode, bez dodatnih pregovora. To otvara nekoliko konkretnih scenarija:
- hrvatske i regionalne tvrtke mogu pokretati moćne modele unutar vlastitih podatkovnih centara ili na EU oblakima,
- proizvođači uređaja i integratori mogu modele stavljati izravno na routere, IoT opremu ili kućanske aparate,
- startupi mogu fino podešavati modele za turizam, logistiku, zdravstvo ili fintech i nuditi ih kao uslugu.
Pritom lokalno izvođenje znači i manju ovisnost o konekciji i niže operativne troškove kod velikih volumena. Za dio tržišta – interni copilot, pretraživanje dokumenata, generiranje koda – kombinacija Gemma 4 + vlastiti GPU može dugoročno biti jeftinija i fleksibilnija od trajnog plaćanja API poziva prema zatvorenim modelima.
4. Šira slika
Gemma 4 se pojavljuje u trenutku kada se oblikuje nekoliko važnih trendova.
Prvo, uspon otvorenih težina. Meta s Llamom, Mistral iz Francuske i drugi pokazali su da modeli čije su težine javno dostupne mogu biti i tehnološki vrh i temelj komercijalnih rješenja. Google je dosad stajao između – snažni zatvoreni Gemini u oblaku, ali poluotvorena Gemma s problematičnom licencom. Apache 2.0 označava izlazak iz te sive zone.
Drugo, pomak prema manjim, ali inteligentnim modelima. 26B MoE, koji pri inferenciji aktivira tek 3,8 milijardi parametara, odražava novu logiku: važnija je latencija i efikasnost nego gola veličina. U kombinaciji s kontekstnim prozorom do 256 tisuća tokena, Gemma 4 je dovoljno jaka za većinu agentnih radnih tokova, osobito kada radi u paru s vanjskim alatima i bazama podataka.
Treće, eksplozija AI‑a na rubu mreže. E2B i E4B su jasna podloga za budući Gemini Nano 4 na Androidu i Pixel uređajima. To znači da će sve više funkcija – detekcija prijevara u pozivima, sažetak bilješki, prepoznavanje teksta s kamera – raditi lokalno na telefonu. U svijetu u kojem i Microsoft (Copilot+ PC) i Apple najavljuju snažan on‑device fokus, Google si ovim potezom osigurava mjesto u utrci.
Konačno, Google ovaj put puno aktivnije gradi ekosustav: težine su na Hugging Faceu, mogu se vrtjeti kroz Ollamu, dostupne su i preko Google Clouda. To je lekcija naučena iz vremena kada je PyTorch prestigao TensorFlow jer je bolje „sjeo“ zajednici.
5. Europski i regionalni kontekst
Za Europsku uniju, uključujući Hrvatsku, Gemma 4 pod Apache 2.0 dolazi u pravom trenutku. GDPR je već godinama realnost, a Uredba o umjetnoj inteligenciji dodatno će pooštriti pravila za rizične AI sustave. Lokalno izvođenje modela – u vlastitim data centrima, na suverenim oblak platformama ili na samim uređajima – regulatorno je daleko jednostavnije od slanja podataka u tuđi oblak izvan EU.
Za javni sektor (e‑Građani, zdravstvo, obrazovanje) i velike sustave u Hrvatskoj je važno i to što je Apache 2.0 dobro poznata licenca; pravne službe se puno lakše nose s njom nego s egzotičnim, proizvoljnim uvjetima. Time se Gemma 4 stavlja u istu „pravnu ligu“ s modelima kao što su Llama i Mistral.
Regionalno, gdje je infrastruktura često heterogena, a vezanost za jednu cloud platformu rizična, otvoreni modeli koji dobro rade i u manjim konfiguracijama (2B, 4B) mogu biti ključ za bržu digitalizaciju – od pametnih gradova do turizma na Jadranu, gdje je sezonsko skaliranje i povremeno loša povezanost realnost.
6. Pogled unaprijed
U sljedećih godinu dana ključno će biti vidjeti hoće li Gemma 4 postati jedan od „zadano dostupnih“ modela u alatima koje regionalni timovi već koriste.
Treba pratiti nekoliko stvari:
- Podrška u alatima i frameworkovima. Hoće li Gemma 4 brzo dobiti prvu klasu podrške u knjižnicama za RAG, agente i orkestraciju (LangChain, LlamaIndex, vLLM, razni serveri za modele)? Ako da, integracija u postojeće projekte u hrvatskim i regionalnim tvrtkama bit će minimalno bolna.
- Performanse u praksi. Koliko dobro Gemma 31B i 26B stvarno rade na uobičajenim GPU‑ovima i u višejezičnim okruženjima (hrvatski, engleski, njemački, talijanski – tipična kombinacija za jadranske turističke operatere)? Sintetički benchmark rezultati su jedno; korisnički dojam u produkciji nešto sasvim drugo.
- Priča o mobitelima. Google je potvrdio da će Gemini Nano 4 biti baziran na Gemmi E2B/E4B. Važno je hoće li te verzije stići i na uređaje izvan Pixela, te hoće li operateri i OEM‑ovi u EU iskoristiti mogućnost da dio AI funkcija rade isključivo lokalno – što bi im moglo pomoći kod usklađivanja s regulativom.
Ostaje i pitanje kontinuiteta: hoće li Google i sljedeće generacije Gemme objavljivati pod Apache licencom, ili je ovo jednokratni ustupak? I kako će se otvoreni modeli tretirati u praktičnoj primjeni Uredbe o AI – kao pozitivni primjeri transparentnosti ili kao dodatni rizik koji zahtijeva posebna pravila?
7. Zaključak
Gemma 4 pod Apache 2.0 predstavlja najuvjerljiviji Googlov iskorak prema otvorenoj, lokalno izvedivoj AI do sada. Modeli nisu najveći na tržištu, ali su dovoljno moćni za širok spektar zadataka – od internih asistenata do pametnih funkcija na mobitelima – i napokon dolaze bez licencnih „kvaka 22“. Ako Google održi kurs, izgradi dobar skup alata i zajednicu, Gemma bi za lokalnu AI mogla postati ono što je Android postao za pametne telefone. Ključno pitanje za hrvatske i regionalne timove glasi: isplati li vam se novu generaciju proizvoda graditi na ovom, sada doista otvorenom, Googlovom sloju?



