Nvidia Rubin: nova AI arhitektura koja 5× ubrzava inferenciju

5. siječnja 2026.
5 min čitanja
Jensen Huang na pozornici CES 2026 predstavlja Nvidijinu Rubin arhitekturu AI čipova

Nvidia je na CES‑u 2026 službeno predstavila Rubin, novu računalnu arhitekturu koja bi trebala naslijediti Blackwell i dodatno učvrstiti dominaciju tvrtke u AI čipovima.

CEO Jensen Huang izašao je na pozornicu 5. siječnja 2026. i potvrdio da je Rubin već u punoj proizvodnji, uz planirano jače povećanje volumena u drugoj polovici godine.

„Vera Rubin je dizajnirana da adresira ovaj temeljni izazov koji imamo: količina izračuna potrebnih za AI strmoglavo raste“, rekao je publici. „Danas vam mogu reći da je Vera Rubin u punoj proizvodnji.“

Arhitektura Rubin, nazvana po astronomkinji Vera Florence Cooper Rubin, prvi je put najavljena 2024. godine. Sada dolazi kao najnoviji korak nakon Blackwella, koji je zamijenio Hopper i Lovelace – dio tvrdog ritma razvoja koji je Nvidiju pretvorio u najvrjedniju korporaciju na svijetu.


Svi veliki oblaci, plus superračunala

Nvidia tvrdi da će čipovi Rubin završiti kod gotovo svih velikih cloud pružatelja. Posebno ističu partnerstva s:

  • Anthropicom
  • OpenAI‑jem
  • Amazon Web Servicesom (AWS)

U svijetu superračunala Rubin će pokretati:

  • Blue Lion superračunalo tvrtke HPE
  • buduće superračunalo Doudna u Lawrence Berkeley National Labu

Za vas u regionalnom ekosustavu — od zagrebačkih i ljubljanskih do beogradskih i sarajevskih timova koji treniraju ili koriste velike modele — velika je vjerojatnost da ćete se s Rubinom susresti preko svojeg cloud dobavljača.


Šest čipova protiv uskih grla

Rubin nije samo novi GPU. Nvidia ga opisuje kao arhitekturu od šest odvojenih čipova koji rade zajedno kako bi uklonili tipična uska grla u AI klasterima.

Glavne komponente su:

  • Rubin GPU – središnji akcelerator za treniranje i inferenciju
  • poboljšanja u BlueFieldu – za pohranu i protok podataka
  • nadograđeni NVLink – za bržu međusobnu povezanost čipova
  • novi Vera CPU – dizajniran za agentsko rezoniranje

Fokus je na memoriji i kretanju podataka. Moderni AI modeli, posebno agentni sustavi i zadaci dugog trajanja, snažno opterećuju KV cache – mehanizam za kondenziranje dugih ulaza.

Nvidijin viši direktor za AI infrastrukturu Dion Harris upravo je na to ukazao dok je objašnjavao novi sloj pohrane u Rubinu.

„Kako počinjete omogućavati nove vrste workflowova, poput agentske AI ili dugotrajnih zadataka, to stvara velik pritisak i zahtjeve na vaš KV cache“, rekao je novinarima. „Zato smo uveli novi sloj pohrane koji se eksterno povezuje s računalnim uređajem i omogućuje vam da puno učinkovitije skalirate svoj storage pool.“

Za operatere to znači: više načina da proširite memoriju i cache bez kupnje dodatnih GPU‑ova samo radi RAM‑a.


3,5× brže treniranje, 5× brža inferencija

Prema internim testovima Nvidije, Rubin donosi veliki skok u odnosu na Blackwell:

  • 3,5× brže treniranje modela
  • 5× brža inferencija
  • do 50 petaflopsa računske snage
  • 8× više inferencijskog izračuna po vatu

Neovisni benchmarki tek trebaju stići, ali brojke jasno pokazuju cilj: što više performansi unutar istih — ili nižih — energetskih ograničenja, što je ključna tema i za podatkovne centre u regiji.


Utrka za 3–4 bilijuna dolara AI infrastrukture

Rubin stiže usred globalne utrke za AI infrastrukturu, u kojoj se laboratoriji i cloud pružatelji bore ne samo za Nvidijine čipove, nego i za dovoljno struje, hlađenja i prostora za njih.

Na pozivu s investitorima u listopadu 2025. Huang je procijenio da će se u sljedećih pet godina na AI infrastrukturu potrošiti 3 do 4 bilijuna američkih dolara.

Za tvrtke i timove iz Hrvatske i šire regije to u praksi znači dvije stvari:

  • novi nivo performansi i efikasnosti ako koristite oblake koji rano usvajaju Rubin
  • još jaču koncentraciju moći oko jednog dobavljača hardvera

Hoće li se pojaviti održive alternativne platforme ili otvoreniji akceleratori koji bi Nvidiji preoteli dio tog kolača, i koliko će brzo Rubin postati dostupan kod regionalnih cloud igrača, bit će ključna pitanja za svaki AI projekt koji gradite u sljedećih nekoliko godina.

Komentari

Ostavite komentar

Još nema komentara. Budite prvi!

Povezani članci

Ostani informiran

Primaj najnovije vijesti iz svijeta AI i tehnologije.