Leto 2026 bo za AI leto streznitve: manjši modeli, pravi agenti in fizične naprave

2. januar 2026
5 min branja
Ilustracija, ki prikazuje povezavo majhnih AI modelov, agentov in fizičnih naprav v letu 2026

Če je bilo leto 2025 leto "vibe checka" za umetno inteligenco, bo 2026 leto streznitve.

Fokus se premika stran od mantran "več podatkov, več parametrov" in proti vprašanju, kako AI dejansko spraviti v uporabo. Manj gre za vedno večje modele in vedno bolj spektakularne demote, bolj za arhitekture, agente in naprave, ki brez drame delujejo v obstoječih procesih.

Od dobe skaliranja do nove raziskovalne faze

Zadnje desetletje je živelo od enostavne ideje: večje je boljše.

  • 2012: AlexNet je pokazal, da lahko GPU‑ji z dovolj podatki "na silo" rešijo računalniški vid.
  • 2020: OpenAI je z GPT‑3 dokazal, da 100‑krat večji model odklene sposobnosti, kot sta programiranje in sklepanje, brez posebnega učenja za vsako nalogo.

Kian Katanforoosh, ustanovitelj in direktor platforme za AI agente Workera, to obdobje imenuje "doba skaliranja" – čas, ko je industrija verjela, da bodo več računske moči, več podatkov in večji transformatorji sami po sebi prinesli naslednji preboj.

Danes vse več raziskovalcev meni, da se tu približujemo stropu.

Yann LeCun, nekdanji glavni znanstvenik za AI pri Meti, že dolgo opozarja, da slepo skaliranje ni dovolj in da potrebujemo boljše arhitekture. Ilya Sutskever je nedavno poudaril, da trenutni modeli dosegajo plato in da se rezultati pred‑učenja izravnavajo – jasen znak, da samo dodajanje parametrov ne bo več delovalo.

"Najverjetneje bomo v naslednjih petih letih našli arhitekturo, ki bo občutno boljša od transformatorjev," je Katanforoosh povedal za TechCrunch. "Če je ne bomo, ne moremo pričakovati veliko izboljšav modelov."

Leto 2026 bo zato prej raziskovalno kot pa tekmovanje v gigavatih.

V ospredje prihajajo manjši jezikovni modeli

V poslovni rabi podjetja ugotavljajo, da so manjši jezikovni modeli (SLM – small language models) pogosto dovolj dobri – in precej cenejši.

Glavni podatkovni direktor AT&T, Andy Markus, pričakuje, da bodo fino uglašeni SLM‑ji v letu 2026 postali standard za zrela podjetja, ki uvajajo AI. Ko jih prilagodite na lastne podatke, lahko po njegovih besedah dosežejo primerljivo natančnost kot veliki modeli, a z boljšimi stroški in hitrostjo.

Na to karto igra tudi francoski startup Mistral, ki trdi, da njegovi manjši odprto‑utežni modeli po fino uglaševanju prehitijo večje konkurente na številnih benchmarkih.

Po oceni Jona Knisleyja, AI stratega v podjetju ABBYY, imajo SLM‑ji tri ključne prednosti:

  • Učinkovitost: manj računske moči, nižja latenca;
  • Stroškovna učinkovitost: več instanc bližje uporabnikom;
  • Prilagodljivost: lažje je doseči visoko natančnost na ozko usmerjenih nalogah.

Ker so modeli manjši, jih je tudi precej lažje poganjati lokalno ali na robu omrežja. So naraven kandidat za agente in sopilote na napravah.

Svetovni modeli iz laboratorija v posel

Veliki jezikovni modeli svet razumejo kot besedilo. Svetovni modeli (world models) se učijo, kako se stvari v 3D prostoru dejansko gibljejo in kako delujejo med seboj.

Ravno v to smer teče vse več denarja in talentov.

  • Yann LeCun je zapustil Meto in ustanovil lasten laboratorij za svetovne modele, za katerega po poročanju išče 5 milijard dolarjev vrednotenja.
  • Google DeepMind razvija Genie, interaktivne svetovne modele v realnem času.
  • World Labs Fei‑Fei Li je lansiral svoj prvi komercialni svetovni model Marble.
  • Startup General Intuition je oktobra zbral 134 milijonov dolarjev začetnega kapitala za učenje prostorskega razmišljanja agentov.
  • Runway je decembra predstavil svoj prvi svetovni model GWM‑1.

Prvi masovni "use case" verjetno ne bodo roboti ali avtonomna vozila, temveč igre.

PitchBook ocenjuje, da bi se trg svetovnih modelov v igričarstvu lahko razširil iz 1,2 milijarde dolarjev (v obdobju 2022–2025) na 276 milijard do leta 2030, predvsem zaradi generativnih interaktivnih svetov in bolj prepričljivih neigranih likov.

Ustanovitelj General Intuition, Pim de Witte, je za TechCrunch poudaril, da bodo virtualna okolja pomembna ne le za igralno industrijo, ampak tudi kot preizkusna polja za naslednjo generacijo temeljnih modelov.

Agenti dobijo svoj "USB‑C": MCP

AI agenti so leta 2025 ustvarili veliko hrupa, a malo resnih uvedb. Glavni razlog: niso imeli dobrega načina za povezavo s sistemi, kjer delo dejansko poteka.

Brez standardnega, varnega dostopa do orodij – od podatkovnih baz do CRM‑ov in internih API‑jev – so agenti ostali ujeti v pilotne projekte.

Tukaj vstopi Model Context Protocol (MCP) podjetja Anthropic.

MCP je praktično "USB‑C za AI" – standardiziran način, kako agenti dostopajo do zunanjih orodij in konteksta. V letu 2025 je tiho zapolnil manjkajoči kos infrastrukture.

Ključni premiki:

  • OpenAI in Microsoft sta javno podprla MCP.
  • Anthropic je protokol podaril Linux Foundation, ki je znotraj nove Agentic AI Foundation zadolžena za odprte standarde za agente.
  • Google je začel ponujati upravljane MCP strežnike za povezovanje agentov s svojimi storitvami.

Z manj trenja pri integraciji je zelo verjetno, da bodo leta 2026 agentni tokovi dela prešli iz demotov v vsakodnevno prakso.

Partner pri skladut tveganega kapitala Sapphire Ventures, Rajeev Dham, pričakuje, da bodo rešitve "agent‑first" prevzemale vloge sistemov evidenc. Glasovni in programski agenti, ki bodo prevzemali celotne naloge, kot sta sprejem zahtevkov in komunikacija s strankami, se bodo po njegovi oceni začeli pojavljati kot jedro sistemov v:

  • storitvah za dom in proptechu,
  • zdravstvu,
  • horizontalnih funkcijah, kot so prodaja, IT in podpora.

Poudarek na povečanju, ne zamenjavi ljudi

Naprednejši agenti običajno sprožijo strah pred odpuščanji.

Katanforoosh verjame nasprotno: leto 2026 bo "leto ljudi".

Leta 2024 je skoraj vsako AI podjetje obljubljalo avtomatizacijo delovnih mest. Zdaj je jasno, da tehnologija še ni tam, hkrati pa je v nestabilnem gospodarstvu retorika o množičnih odpuščanjih težko prodajna.

Po njegovem mnenju bomo v letu 2026 bolj govorili o tem, kako AI dopolnjuje človeško delo, in manj o popolni zamenjavi. Pričakuje nova delovna mesta na področju upravljanja z AI, transparentnosti, varnosti in upravljanja podatkov ter meni, da bo brezposelnost v povprečju ostala pod 4 %.

Pim de Witte je to povzel kratko: "Ljudje želijo biti nad API‑jem, ne pod njim" – in leto 2026 bo pomembno pri definiranju, kaj to v praksi pomeni.

Fizični AI: roboti, vozila, nosljive naprave

Končni del zgodbe o letu 2026 so fizične naprave.

Manjši modeli, svetovni modeli in robno računanje skupaj odpirajo prostor za "physical AI" – za inteligenco, ki ne živi le v oblaku, ampak v robotih, vozilih in na naših telesih.

"Fizični AI bo leta 2026 dosegel mainstream, ko bodo na trg začele prihajati nove kategorije naprav, vključno z robotiko, avtonomnimi vozili, droni in nosljivimi napravami," je za TechCrunch dejal Vikram Taneja, vodja AT&T Ventures.

Roboti in AV‑ji so dragi za učenje in uvajanje. Nosljivci so cenejši vstopni kanal.

Praktični primeri:

  • pametna očala, kot so Meta Ray‑Ban, ki znajo odgovoriti na vprašanja o tem, kar gledate;
  • AI prstani in pametne ure za zdravje, ki normalizirajo stalno inferenco "na telesu".

Vse to tiho pritiska tudi na operaterje in ponudnike infrastrukture.

"Ponudniki povezljivosti bodo morali optimizirati omrežja za ta novi val naprav," opozarja Taneja. Tisti z bolj prilagodljivimi modeli ponudbe bodo v prednosti.

Od hypea k obrabi rokavov

Ko vse to sestavimo, je slika leta 2026 precej jasna:

  • manj slepe vere v skaliranje, več dela na novih arhitekturah;
  • manj megamodelov, več majhnih, fino uglašenih modelov;
  • svetovni modeli, ki iz laboratorijev prihajajo v igre in naprej;
  • agenti, ki so prek MCP resno povezani s poslovnimi sistemi;
  • fizične naprave, ki AI umestijo v vsakdanje okolje.

Hype ne bo izginil. A težišče se seli: od viralnih chatbotov k trdnemu integracijskemu delu in od velikih obljub o avtonomiji k precej bolj prizemljenemu cilju – narediti ljudi, procese in naprave konkretno boljše pri delu, ki ga že opravljajo.

Komentarji

Pustite komentar

Še ni komentarjev. Bodite prvi!

Povezani članki

Ostani na tekočem

Prejemaj najnovejše novice iz sveta AI in tehnologije.