Nakon euforije i "vibe checka" u 2025., 2026. izgleda kao godina prizemljenja za AI.
Manje priče o tome tko ima najveći model, više pitanja: radi li to stvarno u produkciji, uklapa li se u postojeće procese i isplati li se?
Kraj ere čistog skaliranja
Moderni AI boom krenuo je 2012. kad su Alex Krizhevsky, Ilya Sutskever i Geoffrey Hinton s AlexNetom pokazali što GPU‑ovi mogu napraviti na milijunima slika.
Oko 2020. OpenAI je s GPT‑3 gurnuo priču dalje: model stotinjak puta veći od prethodnih odjednom zna programirati i donekle zaključivati bez posebnog treniranja za svaku zadaću.
Kian Katanforoosh, osnivač i CEO Workere (platforma za AI agente), to naziva "dobom skaliranja" – fazom u kojoj su više računa, više podataka i veći transformeri bili glavni recept za napredak.
Sad se sve više vidi plafon.
Yann LeCun, bivši glavni AI znanstvenik Mete, godinama upozorava da se industrija previše oslanja na skaliranje i da trebamo nove arhitekture. Ilya Sutskever je nedavno rekao da trenutni modeli dolaze do plato točke i da se rezultati pre‑treniranja poravnavaju.
"Mislim da ćemo najvjerojatnije u sljedećih pet godina pronaći arhitekturu koja je značajno bolja od transformera", rekao je Katanforoosh za TechCrunch. "Ako ne, ne možemo očekivati veliko poboljšanje modela."
Drugim riječima: 2026. je više godina istraživanja nego još jednog utrkivanja u parametre.
Mali jezični modeli kao radni konji
Za enterprise primjene, sve više stručnjaka gura mali, ali pametno podešen model umjesto jednog megamodela za sve.
Andy Markus, glavni direktor za podatke u AT&T‑u, očekuje da će fino podešeni small language models (SLM‑ovi) u 2026. postati standard kod zrelijih AI korisnika. Po njemu, pravilno fino ugođeni SLM‑ovi mogu po točnosti parirati velikim modelima u poslovnim scenarijima, a uvjerljivo ih pobjeđuju po cijeni i brzini.
Francuski startup Mistral tvrdi isto: njihovi manji, open‑weight modeli nakon fine‑tuninga znaju pobijediti veće konkurente na više benchmarka.
Jon Knisley, AI strateg u ABBYY‑ju, naglašava tri ključne prednosti manjih modela:
- Učinkovitost: manje resursa, niža latencija;
- Trošak: jeftiniji rad i skaliranje;
- Prilagodljivost: bolji za uske, vrlo precizne domene.
Zbog veličine SLM‑ovi su i prirodan kandidat za lokalni ili edge deployment – od servera u vašem data centru do uređaja na rubu mreže.
World modeli: od papira do tržišta (prvo u igrama)
Veliki jezični modeli svijet vide kao tekst. World modeli pokušavaju naučiti kako se stvari kreću i sudaraju u 3D prostoru – da bi mogli predviđati i djelovati.
Tu se u 2026. slijeva sve više novca i talenta.
- Yann LeCun je napustio Metu i pokrenuo vlastiti laboratorij za world modele, za koji navodno cilja valuaciju od 5 milijardi dolara.
- Google DeepMind nastavlja s Geniejem, interaktivnim world modelima u realnom vremenu.
- World Labs Fei‑Fei Li izbacio je svoj prvi komercijalni world model, Marble.
- General Intuition je u listopadu digao 134 milijuna dolara seed runde za prostorno rasuđivanje agenata.
- Runway je u prosincu lansirao svoj prvi world model, GWM‑1.
Iako svi dugoročno gledaju prema robotici i autonomiji, prvi veliki učinak vjerojatno stiže kroz videoigre.
PitchBook procjenjuje da bi tržište world modela u gamingu moglo narasti s 1,2 milijarde dolara (2022.–2025.) na 276 milijardi do 2030., zahvaljujući generiranju interaktivnih svjetova i uvjerljivijih NPC‑eva.
Osnivač General Intuitiona, Pim de Witte, rekao je za TechCrunch da bi takva virtualna okruženja mogla postati ključni poligon za testiranje iduće generacije foundation modela.
MCP: standard koji agentima treba da postanu korisni
AI agenti su 2025. bili jako glasni, ali često beskorisni u praksi. Glavni problem: nisu imali uredan način da dođu do alata i podataka gdje se posao stvarno obavlja.
Bez povezivanja na baze podataka, interne API‑je, CRM‑ove ili tražilice, većina agenata je ostala zarobljena u pilotima i demo‑ovima.
Anthropicov Model Context Protocol (MCP) tu postaje ključan komad slagalice.
MCP je zamišljen kao "USB‑C za AI" – standardizirani način da agenti pričaju s vanjskim alatima.
Što se dogodilo u 2025.:
- OpenAI i Microsoft javno su prihvatili MCP.
- Anthropic je protokol donirao Linux Foundationu, unutar nove Agentic AI Foundation, kako bi se razvio otvoreni standard za agentičke alate.
- Google je počeo postavljati svoje upravljane MCP servere za spajanje agenata na Googleove servise.
Kako frikcija pada, 2026. bi mogla biti godina kad agentični workflowi napokon izađu iz prezentacija i uđu u svakodnevni rad.
Rajeev Dham, partner u Sapphire Ventures, očekuje da će "agent‑first" rješenja preuzimati uloge sustava evidencije. Kako glasovni i softverski agenti krenu odrađivati end‑to‑end zadatke poput intakea i komunikacije s korisnicima, mogli bi postati jezgra sustava u sektorima kao što su:
- kućne usluge i proptech,
- zdravstvo,
- horizontalne funkcije poput prodaje, IT‑a i podrške.
Fokus na augmentaciji, ne na otkazima
Svaki put kad agenti naprave skok, otvori se pitanje: hoće li ova tehnologija pojesti radna mjesta?
Kian Katanforoosh misli da 2026. neće biti godina masovne automatizacije.
Kaže da ćemo uvidjeti da "AI nije radio toliko autonomno koliko smo mislili" i da će rasprava ići više prema tome kako AI povećava i ubrzava ljudski rad, umjesto da ga zamijeni. Očekuje nova radna mjesta u AI upravljanju, transparentnosti, sigurnosti i upravljanju podacima te je, kako kaže, prilično optimističan da bi nezaposlenost mogla u prosjeku ostati ispod 4 %.
Pim de Witte je to sažeo rečenicom koja će se sigurno citirati: "People want to be above the API, not below it" – ljudi žele biti iznad API‑ja, ne ispod njega. 2026. će pokazati koliko ozbiljno tvrtke to shvaćaju.
Fizički AI: od clouda do naočala, prstena i drona
Posljednji dio slagalice su fizičke primjene – "physical AI".
Napredak u malim modelima, world modelima i edge računanju omogućit će da se AI sve više seli iz clouda u uređaje.
"Fizički AI će 2026. ući u mainstream kad nove kategorije AI uređaja, uključujući robotiku, autonomna vozila, dronove i nosive uređaje, krenu na tržište", rekao je za TechCrunch Vikram Taneja, šef AT&T Ventures.
AV‑i i roboti ostaju važni, ali su skupi za treniranje i implementaciju. Nosivi uređaji su jeftiniji ulaz s puno boljim prihvaćanjem korisnika.
Primjeri koji već stižu:
- pametne naočale poput Meta Ray‑Ban modela, čiji asistent može odgovoriti na pitanja o onome što gledate;
- AI prstenovi za zdravlje i pametni satovi, koji normaliziraju stalnu inferenciju "na tijelu".
Za operatere i pružatelje infrastrukture to znači tihi, ali ozbiljan pritisak.
"Pružatelji povezivosti radit će na optimizaciji mrežne infrastrukture za novi val uređaja", kaže Taneja, uz napomenu da će oni s većom fleksibilnošću ponude biti u najboljoj poziciji.
Od hypea do rada rukama
Kad sve zbrojite, 2026. izgleda kao godina u kojoj AI odrasta:
- manje vjere u gole parametre, više rada na arhitekturama;
- umjesto jednog gigantskog modela – mnoštvo malih, fino podešenih;
- world modeli koji izlaze iz istraživanja u gaming i dalje;
- agenti koji su preko MCP‑a stvarno spojeni na sustave;
- fizički uređaji koji AI čine opipljivim u svakodnevici.
Party nije gotov, ali muzika se stišava. Slijedi faza prljanja ruku: manje demo magije, više integracijskog, dosadnog – ali za biznis ključnog – rada.



