Naslov i uvod
Rasprava o generativnoj AI zadnje dvije godine vrti se oko jednog pitanja: koji je model „najpametniji“. Razgovor koji je TechCrunch vodio s Michaelom Gerstenhaberom, voditeljem Cloud AI odjela u Googleu, sugerira da je takav pogled previše pojednostavljen. On opisuje tri granice na koje se modeli danas naslanjaju: inteligenciju, latenciju i trošak pri velikom, nepredvidljivom opsegu. To nije akademska vježba, već praktičan alat za sve koji u regiji grade AI rješenja – od zagrebačkih i ljubljanskih startupova do velikih telekoma. U nastavku analiziram zašto ovaj okvir mijenja igru i što znači za Europu i jugoistočnu Europu.
Vijest ukratko
Kako prenosi TechCrunch, Michael Gerstenhaber, potpredsjednik za proizvod u Google Cloudu zadužen za platformu Vertex AI, nudi trodimenzionalni pogled na napredak AI modela. Na temelju iskustva u Anthropicu i Googleu tvrdi da se modeli istodobno razvijaju u tri smjera: sirova inteligencija, vrijeme odgovora i mogućnost cjenovno održivog rada pri nepoznatom broju poziva.
Svoje viđenje ilustrira tipičnim slučajevima. Kod složenog programiranja cilj je maksimalna inteligencija – prihvatljivo je i nekoliko minuta čekanja. U korisničkoj podršci ili drugim interakcijama u realnom vremenu inteligenciju ograničava strogi budžet latencije; savršen odgovor bez korisnika na liniji ne vrijedi ništa. Kod masovnih zadataka poput moderiranja sadržaja na mreži odlučujući je trošak po pozivu.
Gerstenhaber također objašnjava zašto se tzv. agentski sustavi – AI agenti koji samostalno koriste alate i podatke – uvode sporije nego što sugerira hype. Po njemu nedostaju ustaljeni obrasci za reviziju njihova ponašanja, za autorizaciju pristupa podacima i za sigurno uklapanje u postojeće procese, uz iznimku razvoja softvera gdje takvi mehanizmi već postoje.
Zašto je to važno: kompas za realne AI projekte
Model triju granica zvuči jednostavno, ali je vrlo koristan korektiv dominantne priče o „najpametnijem modelu“. Ako ste CIO, CTO ili voditelj proizvoda, ključno pitanje više nije koji je model objektivno najbolji, nego koliko nam inteligencije stvarno treba, uz kakvu latenciju i po kojoj cijeni – za ovaj konkretan proces.
Dobitnici su svi koji na AI gledaju pragmatično. Intuicija da „najveći model“ često nije optimalan dobiva teorijsku podlogu. Nabava koja uspoređuje samo rezultate benchmarka zanemaruje ključne varijable: strpljenje korisnika, ugovorene rokove odgovora, volatilnost troškova. U ozbiljnim sustavima, od bankarstva do maloprodaje, te su dimenzije često važnije od još jednog postotka točnosti.
Veliki cloud igrači s portfeljem modela također profitiraju. Google može rasporediti različite verzije Geminija duž tri osi: najjače za duboke zadatke, lakše za brze interakcije, manjeg kapaciteta za masovnu obradu. Sličnu strategiju provode OpenAI i Anthropic. Činjenica da visoki dužnosnik Google Clouda to javno artikulira znači da je era jednog „zastavnog“ modela završena.
Gubitnici su startupovi koji se oslanjaju isključivo na priču „naš je model malo bolji“ bez jasne prednosti u trošku, latenciji ili integraciji. I poduzeća koja AI u proračunu vode kao jednu crtu, umjesto kao skup različitih sposobnosti koje moraju biti pažljivo kalibrirane na svakoj od tri granice.
Možda je najzanimljiviji dio poruka o agentima: problem više nije u sposobnosti modela, nego u odsutnosti procesa, kontrola i alata koji bi omogućili da im stvarno prepustimo dio posla, a da ne riskiramo reputaciju ili regulatornu kaznu.
Šira slika: od jednog „velikog mozga“ do mreže specijaliziranih servisa
Gerstenhaberovo razmišljanje lijepo se uklapa u šire trendove na tržištu AI‑ja.
Prvo, objašnjava zašto su svi veliki laboratoriji prešli s jednog „flagship“ modela na obitelji modela. OpenAI, Anthropic i Google danas nude više verzija istog modela različito pozicioniranih u odnosu na kvalitetu, brzinu i cijenu. Ne radi se samo o cjenovnim razredima, već o namjernom zauzimanju točaka u prostoru inteligencija–latencija–trošak.
Drugo, stavlja u perspektivu raspravu o agentskim sustavima. Mnoge današnje demonstracije koriste najskuplje modele za trivijalne zadatke, što nepotrebno povećava latenciju i račun za cloud. Stvarni poslovni procesi kombiniraju duboko zaključivanje, kratke interakcije i masovno razvrstavanje. Ozbiljna agentska platforma morat će znati dinamički prebacivati između više modela, koristiti keširanje, predobradu i poslovna pravila. Strategijska prednost seli se s „sirovog“ modela na orkestracijski sloj.
Treće, otvara prostor za novu infrastrukturu: alate za detaljnu reviziju ponašanja agenata, fine kontrole pristupa podacima, simulacijska okruženja prije produkcije. Tko se sjeća ranih dana DevOpsa i mikrousloga, prepoznat će uzorak – tehnologija postoji, ali alati i prakse upravljanja još kasne.
Povijesno, slično se događalo i pri prelasku s monolitnih aplikacija na mikrousloge. Fokus se pomaknuo s snage jednog poslužitelja na latenciju, SLO‑ove i trošak po zahtjevu. Generativna AI prolazi sličnu tranziciju: od IQ‑a pojedinog modela prema inženjerstvu složenih sustava.
Europski i regionalni kut: regulativa, troškovi i prilike
Iz europske perspektive Gerstenhaberove ideje vrlo su blizu onome što donose novi propisi. Na granici inteligencije, modeli koji sudjeluju u odlukama o kreditu, zapošljavanju ili zdravstvu vjerojatno će prema Aktu o umjetnoj inteligenciji EU biti klasificirani kao visokorizični. To znači obvezno upravljanje rizicima, opsežnu dokumentaciju, zapisnike o radu sustava i ljudski nadzor. Njegov naglasak na reviziji agentskih sustava praktički je nacrt budućih obveza.
Na granici latencije, mnoge banke, telekomi i javne institucije u Hrvatskoj, Sloveniji i šire uvode chatbote i AI asistente. Korisnik u Zagrebu ili Splitu nema beskonačno strpljenje – a u nekim sektorima postoje i zakonski rokovi za odgovor. Ne možete si priuštiti superpametnog, ali sporog agenta u kontakt centru.
Na granici troška i skale, regionalne platforme s korisničkim sadržajem – oglasnici, mediji s komentarima, forumi – moraju moderirati velik volumen uz poštivanje EU pravila (Digital Services Act, nacionalni zakoni o govoru mržnje). Gurati svaki komentar kroz najskuplji model jednostavno nije opcija. Razumnije su višeslojne arhitekture: brzi i jeftini filteri za većinu sadržaja, precizniji modeli i na kraju ljudi za teške slučajeve.
Za europske i regionalne pružatelje clouda i AI ovo je i prijetnja i šansa. Googleova vertikalna integracija – od podatkovnih centara i čipova do modela i agentnih slojeva – teško je dostižna. No lokalni igrači mogu se diferencirati kroz podatkovni suverenitet, rješenja usklađena s EU regulativom i gotove agentske sustave za specifične industrije (turizam, logistika, javni sektor) koji se naslanjaju na globalne modele, ali ostaju u europskim pravnim i energetskim okvirima.
Za hrvatske tvrtke – od velikih poput Infobipa do manjih SaaS timova u Zagrebu i Splitu – to znači da će morati vrlo precizno birati gdje im se doista isplati koristiti najnaprednije modele, a gdje je pametnije osloniti se na brže, jeftinije i užespecijalizirane modele.
Pogled unaprijed: od izbora modela do dizajna sustava
Ako Gerstenhaberov okvir uzmemo ozbiljno, iduće faze uvođenja AI‑ja neće obilježiti još jedan spektakularni skok u inteligenciji, nego sposobnost organizacija da dizajniraju sustave duž tri granice.
Manje ćemo slušati „kojeg providera koristiti“, a više: za ovaj proces, koja je maksimalno prihvatljiva latencija, koliko pogrešaka možemo tolerirati, koliki je ciljani trošak po interakciji? Tek unutar tih ograničenja ima smisla razgovarati o izboru modela, keširanju, predobradi i eskalacijskim putevima prema jačim modelima ili ljudima.
Veliki cloudovi vjerojatno će nuditi sve više predefiniranih profila – optimiziranih za cijenu, brzinu ili kvalitetu – i u pozadini automatski prebacivati između više modela. To povećava učinkovitost, ali smanjuje transparentnost. Regulatori i klijenti u EU s pravom će pitati koji je točno sustav donio određenu odluku.
Na razini agenata možemo očekivati razvoj novih alata: sandbox okruženja za testiranje, simulacijske platforme, formalne jezike za politike, nove uloge u timovima (nešto poput „agent ops“, analogno SRE‑u). Organizacije u EU, navikle na stroge procedure promjena, tu bi mogle imati prednost pred labavijim modelima rada u Silicijskoj dolini.
Rizici ostaju. Prvi je zaključavanje na jednog dobavljača: duboko integrirane platforme olakšavaju početak, ali otežavaju promjenu ako se promijene cijene ili regulativa. Drugi je rizik upravljanja: ako agenti dobiju preširoke ovlasti bez jasnih ograda, prvi incidenti mogli bi dovesti do vrlo strogih ograničenja, posebno u EU. Treći su sami troškovi: ako svaki problem rješavate najskupljim modelom, CFO će vrlo brzo povući ručnu.
Zaključak
Gerstenhaberov prikaz triju granica više je od zgodne metafore; to je praktičan vodič za sljedeću fazu primjene umjetne inteligencije u poslovanju. Inteligencija, latencija i trošak nisu samo tehničke metrike, već poluge na kojima se lome isplativost, usklađenost s regulativom i povjerenje korisnika. Tvrtke koje rano usvoje ovakav sustavni način razmišljanja – i istovremeno investiraju u reviziju i kontrolu agentskih sustava – steći će trajnu prednost. One koje nastave slijepo ganjati „najpametniji model“ vjerojatno će preplatiti, podbaciti u isporuci i brže se sudariti s regulatorima. Ključno je pitanje: gdje na ove tri granice zapravo treba smjestiti vaš sljedeći AI projekt?



