Googlovi TPU 8 ne ruše Nvidije, nego mijenjaju uvjete igre u oblaku

Naslov i uvod

Googlovi novi čipovi za umjetnu inteligenciju nisu udarac kojim će srušiti Nvidiju, nego potez kojim još jače učvršćuje moć hiperskalnih oblaka. S TPU 8t čipom za treniranje modela i TPU 8i za izvođenje (inference) Google želi da što veći dio AI‑radnih opterećenja nikada ne napusti njegovu infrastrukturu.

U nastavku donosimo sažetak vijesti, analiziramo tko dobiva a tko gubi, kako se ovo uklapa u širi trend prilagođenih čipova te što sve to znači za Europu i regiju jugoistočne Europe, uključujući hrvatske tvrtke i startupe.

Vijest ukratko

Prema pisanju TechCruncha, Google Cloud je na konferenciji Next predstavio osmu generaciju svojih vlastitih akceleratora za umjetnu inteligenciju – Tensor Processing Units (TPU). Prvi put linija je podijeljena na dva proizvoda: TPU 8t je namijenjen treniranju velikih AI modela, a TPU 8i je optimiziran za fazu izvođenja, kada modeli odgovaraju na korisničke upite.

Google navodi da novi TPU‑ovi omogućuju i do tri puta brže treniranje u odnosu na prethodnu generaciju te oko 80 % bolje performanse po utrošenom dolaru. Mogu se povezati u golema klaster‑računala s više od milijun TPU‑ova u jednom sustavu.

Ipak, novi čipovi ne zamjenjuju Nvidijine GPU‑ove u Google Cloudu. Kako piše TechCrunch, Google će i dalje nuditi najnoviji Nvidijin hardver, uključujući nadolazeći čip Vera Rubin, te surađuje s Nvidijom na razvoju mrežnih tehnologija poput Falcona – softverski definiranog mrežnog sustava koji je Google 2023. otvorio kroz Open Compute Project.

Zašto je to važno

Na površini ovo izgleda kao sukob „Google protiv Nvidije“. U stvarnosti je to sukob „veliki oblaci protiv svih ostalih“.

TPU‑ovi postoje isključivo unutar Google Clouda. Svaka nova, efikasnija generacija produbljuje jaz između:

korisnika koji prihvate Googlovu vlasničku platformu, i
onih koji pokušavaju graditi AI na standardnom hardveru u vlastitim podatkovnim centrima ili kod manjih pružatelja oblaka.

Ako se pokaže da TPU 8 stvarno donosi do tri puta brže treniranje i 80 % bolje performanse po dolaru, ekonomija se dodatno naginje u korist hiperskalera. Za AI startupe u Zagrebu ili Ljubljani, za SaaS tvrtke u regiji i za korporativne IT odjele bit će sve teže opravdati kupnju i održavanje vlastitih GPU klastera.

Podjela na TPU 8t (treniranje) i 8i (izvođenje) strateški je važna jer treniranje i inference imaju potpuno različitu ekonomiju:

treniranje je povremeno, skupo i rizično,
izvođenje je stalno, predvidljivo i pod snažnim cjenovnim pritiskom.

Sa specijaliziranim čipovima Google može zasebno optimizirati i jedno i drugo: treniranje prodavati kao „premium“ kapacitet, a izvođenje kao masovnu, cjenovno učinkovitu uslugu. To znači više prostora za manevriranje s cijenama i maržama.

Kratkoročno, Nvidia ne gubi mnogo – Google i dalje masovno kupuje njezine GPU‑ove i s njom surađuje na boljem umrežavanju sustava. Dok god globalna potražnja za AI računanjem raste strmim tempom, Nvidia će prodavati sve što proizvede.

Pritisak se više osjeća kod:

manjih oblaka i dobavljača on‑prem rješenja, koji nemaju šanse razvijati vlastite čipove,
korisnika, koji danas dobivaju jeftiniju i bržu AI, ali za uzvrat prihvaćaju dublju ovisnost o jednoj kombinaciji čipova, API‑ja i alata.

Šira slika

TPU 8 pripada već jasno vidljivom trendu: hiperskalni pružatelji oblaka sve više vertikalno integriraju AI stog.

Amazon ima svoje čipove Trainium i Inferentia. Microsoft je predstavio akcelerator Maia i procesor Cobalt. Meta razvija vlastite čipove za preporučne sustave i generativnu AI. Svi oni paralelno kupuju ogromne količine Nvidijina hardvera.

Obrazac je sličan:

Nvidia ostaje referenca i kompatibilnosna osnova – većina AI softvera i alata optimizirana je za to okruženje.
Vlastiti čipovi se uvode ondje gdje najviše boli – kod najvećih treninga i masovnog izvođenja modela, gdje su računalni troškovi golem teret.
Hardver se skriva iza upravljanih servisa – korisnici više ne kupuju GPU, nego „platformu za treniranje“, „vektorsku bazu“, „chat API“. Čip postaje interna implementacijska sitnica.

Sličnu evoluciju već smo gledali kod mrežne opreme i pohrane podataka: kad su se volumeni koncentrirali u oblaku, nastao je pritisak da se i hardver optimizira baš za te potrebe.

Za Nvidiju je rizik manje u ovom konkretnom proizvodu, a više u dugoročnom prebacivanju ravnoteže moći. Dok je potražnja veća od proizvodnih kapaciteta, sve izgleda idilično. No u trenutku kada se tržište normalizira, bit će važno koliki udio AI opterećenja u Amazonu, Googleu ili Microsoftu radi na njihovom vlastitom siliciju, a koliko na Nvidijinim GPU‑ovima.

Činjenica da Google i Nvidia zajedno razvijaju Falcon naglašava da ključan rov nije samo čip, nego cijeli sustav: mreža, interkonekti, softver, orkestracija, energetika. Tu se na kraju odlučuje tko može dugoročno nuditi jeftinu AI, a ipak ostati profitabilan.

Europski i regionalni kut

Za Europu i države EU, uključujući Hrvatsku, TPU 8 donosi i prilike i rizike.

Pozitivno: više i jeftinijeg AI računa u Google Cloudu olakšava život startupima u Zagrebu, Splitu ili Ljubljani, istraživačkim grupama na FER‑u ili PMF‑u te tvrtkama koje žele ugraditi napredne modele u svoje proizvode. To ide u smjeru ciljeva EU oko digitalne transformacije i programa poput Digitalna Europa.

Negativno: TPU‑ovi su dostupni isključivo u Googleovim podatkovnim centrima, izvan kontrole domaćih aktera. To nije u skladu s naglaskom na digitalni suverenitet, inicijativama poput GAIA‑X i s europskim Aktom o čipovima, koji upravo želi smanjiti ovisnost o trećim zemljama.

Regulatorni okvir dodatno kompliciraju GDPR, Akt o digitalnim uslugama (DSA), Akt o digitalnim tržištima (DMA) te nadolazeći EU Akt o umjetnoj inteligenciji. Svi oni naglašavaju transparentnost, prenosivost i mogućnost promjene pružatelja usluga.

Europski i regionalni pružatelji oblaka – od OVHclouda i Scalewaya do lokalnih data centara i telekoma – teško mogu konkurirati s vlastitim čipovima, pa se oslanjaju na standardne GPU‑ove. Ako Google agresivno iskoristi prednosti TPU‑a, razlika u cijenama može dodatno ojačati koncentraciju tržišta kod nekoliko globalnih igrača.

Za hrvatske tvrtke to znači realan izbor: prihvatiti jeftiniji i brži AI u američkom oblaku, uz veću ovisnost i potencijalne probleme s usklađenošću, ili platiti više za hibride i domaća rješenja koja nude veću kontrolu.

Pogled unaprijed

U sljedećih godinu do dvije ključna tema neće biti samo „tko ima brži čip“, nego „tko može ponuditi uvjerljiviji poslovni model“.

Vrlo je vjerojatno da će Google TPU 8t/8i koristiti za:

agresivno snižavanje cijena treniranja i izvođenja za one koji pristanu na TPU,
paketiranje AI‑a u servise više razine (plaćanje po tokenu, po zahtjevu, po funkcionalnosti),
širenje dostupnosti TPU‑ova u EU regijama, kako bi privukao visoko regulirane sektore.

Na što bi hrvatske i regionalne organizacije trebale obratiti pažnju?

Prenosivost modela – Koliko je lako premještati modele između Nvidijinih GPU‑ova (bilo u oblaku ili on‑premise) i TPU‑ova? Kakav je realan trošak zaključavanja u jedan ekosustav?
Multi‑cloud alati – Podržavaju li MLOps platforme, orkestratori i otvoreni alati TPU kao ravnopravan cilj ili je to posebna, „googleovska“ staza?
Primjenu EU regulative – Kako će se DMA i EU AI Act tumačiti u praksi kad je riječ o obvezama velikih oblaka da olakšaju prelazak korisnika i interoperabilnost?

Ni za Google rizici nisu mali. Ako potrošnja za AI usluge uspori ili ako kupci krenu ozbiljnije inzistirati na prenosivosti i otvorenim standardima, vrlo skupi programi razvoja čipova mogu postati teret. Istodobno, konkurentske inicijative – od europskih RISC‑V projekata do kineskih akceleratora – dugoročno mogu narušiti ekonomiju zatvorenih rješenja.

Nvidia će, s druge strane, vjerojatno još dugo imati pune narudžbenice. Prava prekretnica bit će trenutak kada udio radnih opterećenja na vlastitim čipovima hiperskalera počne ozbiljnije gristi njezin kolač.

Zaključak

Googlovi TPU 8t i 8i ne ruše Nvidiju, ali učvršćuju trend prema zatvorenim, vertikalno integriranim AI platformama pod kontrolom nekoliko globalnih oblaka. Korisnici kratkoročno dobivaju više snage za manje novca, a dugoročno plaćaju većom ovisnošću i manjom mogućnošću izbora.

Za hrvatske i regionalne tvrtke ključna će biti odluka: optimizirati za najnižu cijenu AI izračuna danas ili za slobodu da sutra bez bolova promijene dobavljača i arhitekturu?

Googlovi TPU 8 ne ruše Nvidije, nego mijenjaju uvjete igre u oblaku

Naslov i uvod

Vijest ukratko

Zašto je to važno

Šira slika

Europski i regionalni kut

Pogled unaprijed

Zaključak

Komentari

Ostavite komentar

Povezani članci

ChatGPT Images 2.0: Indija je poligon za masovnu AI, Europa tek promatra

Kad AI dođe na selo: što američki rat oko podatkovnih centara znači za Hrvatsku

GitHub Copilot pod nadzorom: zašto završava „flat rate“ AI kodiranje

Ostani informiran