Gemma 4 pod Apache 2.0: Googlov zaokret prema otvorenoj, lokalnoj AI

2. travnja 2026.
5 min čitanja
Ilustracija Gemma 4 AI modela koji rade na poslužitelju i pametnom telefonu

1. Naslov i uvod

Google je povukao potez koji bi dugoročno mogao biti važniji od još jednog moćnog oblačnog modela: Gemma 4 dolazi s otvorenim težinama i – još važnije – s prijelazom na licencu Apache 2.0. To je jasna poruka da lokalno izvođenje umjetne inteligencije više nije eksperiment nego strategija. Za hrvatske i regionalne tvrtke, od banaka do turističkog sektora i zagrebačkih startupa, to otvara nove opcije kako graditi AI sustave pod vlastitom kontrolom. U nastavku analiziramo zašto je licenca ključ priče, kako se Gemma 4 uklapa u globalnu utrku i što znači za razvoj AI u EU i jugoistočnoj Europi.

2. Vijest ukratko

Prema pisanju Ars Technice, Google je predstavio Gemmu 4, novu generaciju otvorenih AI modela i prvu veliku nadogradnju Gemme nakon otprilike godinu dana. Obitelj se sastoji od četiri modela: dva veća za lokalne servere – 26‑milijardni Mixture of Experts (MoE) i 31‑milijardni gusti model – te dva učinkovita rubna modela Effective 2B (E2B) i Effective 4B (E4B), usmjerena na mobilne uređaje i hardver niske potrošnje.

Veći modeli su dizajnirani da rade ne‑kvantizirani na jednoj Nvidia H100 GPU kartici s 80 GB memorije, a nakon kvantizacije mogu raditi i na potrošačkim GPU‑ovima. E2B i E4B su optimizirani u suradnji s Pixel timom te Qualcommom i MediaTekom za rad na pametnim telefonima te pločama poput Raspberry Pi i Jetson Nano, uz naglasak na malu potrošnju memorije i nisku latenciju.

Najveća novost je licenca: Google napušta vlastitu Gemma licencu i Gemmu 4 objavljuje pod Apache 2.0, permisivnom licencom koju pravnici i developeri dobro poznaju. Modeli su dostupni putem Google AI Studija i AI Edge Galleryja, u Google Cloudu te kao težine za preuzimanje na platformama poput Hugging Facea, Kagglea i Ollame.

3. Zašto je to važno

Ključna promjena nije samo u performansama, već u povjerenju. Prethodna Gemma licenca bila je za mnoge organizacije crvena lampica: široko definirana zabranjena uporaba, mogućnost jednostranih izmjena i nejasnoće oko toga prenose li se ograničenja i na druge modele trenirane na Gemminim sintetičkim podacima. Malo koji pravni odjel u banci ili telekomu želi takav rizik.

Prelaskom na Apache 2.0 Google praktički kaže: možete slobodno ugrađivati Gemmu u svoje proizvode, bez dodatnih pregovora. To otvara nekoliko konkretnih scenarija:

  • hrvatske i regionalne tvrtke mogu pokretati moćne modele unutar vlastitih podatkovnih centara ili na EU oblakima,
  • proizvođači uređaja i integratori mogu modele stavljati izravno na routere, IoT opremu ili kućanske aparate,
  • startupi mogu fino podešavati modele za turizam, logistiku, zdravstvo ili fintech i nuditi ih kao uslugu.

Pritom lokalno izvođenje znači i manju ovisnost o konekciji i niže operativne troškove kod velikih volumena. Za dio tržišta – interni copilot, pretraživanje dokumenata, generiranje koda – kombinacija Gemma 4 + vlastiti GPU može dugoročno biti jeftinija i fleksibilnija od trajnog plaćanja API poziva prema zatvorenim modelima.

4. Šira slika

Gemma 4 se pojavljuje u trenutku kada se oblikuje nekoliko važnih trendova.

Prvo, uspon otvorenih težina. Meta s Llamom, Mistral iz Francuske i drugi pokazali su da modeli čije su težine javno dostupne mogu biti i tehnološki vrh i temelj komercijalnih rješenja. Google je dosad stajao između – snažni zatvoreni Gemini u oblaku, ali poluotvorena Gemma s problematičnom licencom. Apache 2.0 označava izlazak iz te sive zone.

Drugo, pomak prema manjim, ali inteligentnim modelima. 26B MoE, koji pri inferenciji aktivira tek 3,8 milijardi parametara, odražava novu logiku: važnija je latencija i efikasnost nego gola veličina. U kombinaciji s kontekstnim prozorom do 256 tisuća tokena, Gemma 4 je dovoljno jaka za većinu agentnih radnih tokova, osobito kada radi u paru s vanjskim alatima i bazama podataka.

Treće, eksplozija AI‑a na rubu mreže. E2B i E4B su jasna podloga za budući Gemini Nano 4 na Androidu i Pixel uređajima. To znači da će sve više funkcija – detekcija prijevara u pozivima, sažetak bilješki, prepoznavanje teksta s kamera – raditi lokalno na telefonu. U svijetu u kojem i Microsoft (Copilot+ PC) i Apple najavljuju snažan on‑device fokus, Google si ovim potezom osigurava mjesto u utrci.

Konačno, Google ovaj put puno aktivnije gradi ekosustav: težine su na Hugging Faceu, mogu se vrtjeti kroz Ollamu, dostupne su i preko Google Clouda. To je lekcija naučena iz vremena kada je PyTorch prestigao TensorFlow jer je bolje „sjeo“ zajednici.

5. Europski i regionalni kontekst

Za Europsku uniju, uključujući Hrvatsku, Gemma 4 pod Apache 2.0 dolazi u pravom trenutku. GDPR je već godinama realnost, a Uredba o umjetnoj inteligenciji dodatno će pooštriti pravila za rizične AI sustave. Lokalno izvođenje modela – u vlastitim data centrima, na suverenim oblak platformama ili na samim uređajima – regulatorno je daleko jednostavnije od slanja podataka u tuđi oblak izvan EU.

Za javni sektor (e‑Građani, zdravstvo, obrazovanje) i velike sustave u Hrvatskoj je važno i to što je Apache 2.0 dobro poznata licenca; pravne službe se puno lakše nose s njom nego s egzotičnim, proizvoljnim uvjetima. Time se Gemma 4 stavlja u istu „pravnu ligu“ s modelima kao što su Llama i Mistral.

Regionalno, gdje je infrastruktura često heterogena, a vezanost za jednu cloud platformu rizična, otvoreni modeli koji dobro rade i u manjim konfiguracijama (2B, 4B) mogu biti ključ za bržu digitalizaciju – od pametnih gradova do turizma na Jadranu, gdje je sezonsko skaliranje i povremeno loša povezanost realnost.

6. Pogled unaprijed

U sljedećih godinu dana ključno će biti vidjeti hoće li Gemma 4 postati jedan od „zadano dostupnih“ modela u alatima koje regionalni timovi već koriste.

Treba pratiti nekoliko stvari:

  1. Podrška u alatima i frameworkovima. Hoće li Gemma 4 brzo dobiti prvu klasu podrške u knjižnicama za RAG, agente i orkestraciju (LangChain, LlamaIndex, vLLM, razni serveri za modele)? Ako da, integracija u postojeće projekte u hrvatskim i regionalnim tvrtkama bit će minimalno bolna.
  2. Performanse u praksi. Koliko dobro Gemma 31B i 26B stvarno rade na uobičajenim GPU‑ovima i u višejezičnim okruženjima (hrvatski, engleski, njemački, talijanski – tipična kombinacija za jadranske turističke operatere)? Sintetički benchmark rezultati su jedno; korisnički dojam u produkciji nešto sasvim drugo.
  3. Priča o mobitelima. Google je potvrdio da će Gemini Nano 4 biti baziran na Gemmi E2B/E4B. Važno je hoće li te verzije stići i na uređaje izvan Pixela, te hoće li operateri i OEM‑ovi u EU iskoristiti mogućnost da dio AI funkcija rade isključivo lokalno – što bi im moglo pomoći kod usklađivanja s regulativom.

Ostaje i pitanje kontinuiteta: hoće li Google i sljedeće generacije Gemme objavljivati pod Apache licencom, ili je ovo jednokratni ustupak? I kako će se otvoreni modeli tretirati u praktičnoj primjeni Uredbe o AI – kao pozitivni primjeri transparentnosti ili kao dodatni rizik koji zahtijeva posebna pravila?

7. Zaključak

Gemma 4 pod Apache 2.0 predstavlja najuvjerljiviji Googlov iskorak prema otvorenoj, lokalno izvedivoj AI do sada. Modeli nisu najveći na tržištu, ali su dovoljno moćni za širok spektar zadataka – od internih asistenata do pametnih funkcija na mobitelima – i napokon dolaze bez licencnih „kvaka 22“. Ako Google održi kurs, izgradi dobar skup alata i zajednicu, Gemma bi za lokalnu AI mogla postati ono što je Android postao za pametne telefone. Ključno pitanje za hrvatske i regionalne timove glasi: isplati li vam se novu generaciju proizvoda graditi na ovom, sada doista otvorenom, Googlovom sloju?

Komentari

Ostavite komentar

Još nema komentara. Budite prvi!

Povezani članci

Ostani informiran

Primaj najnovije vijesti iz svijeta AI i tehnologije.