Naslov i uvod
Googlovi novi čipovi za umjetnu inteligenciju nisu udarac kojim će srušiti Nvidiju, nego potez kojim još jače učvršćuje moć hiperskalnih oblaka. S TPU 8t čipom za treniranje modela i TPU 8i za izvođenje (inference) Google želi da što veći dio AI‑radnih opterećenja nikada ne napusti njegovu infrastrukturu.
U nastavku donosimo sažetak vijesti, analiziramo tko dobiva a tko gubi, kako se ovo uklapa u širi trend prilagođenih čipova te što sve to znači za Europu i regiju jugoistočne Europe, uključujući hrvatske tvrtke i startupe.
Vijest ukratko
Prema pisanju TechCruncha, Google Cloud je na konferenciji Next predstavio osmu generaciju svojih vlastitih akceleratora za umjetnu inteligenciju – Tensor Processing Units (TPU). Prvi put linija je podijeljena na dva proizvoda: TPU 8t je namijenjen treniranju velikih AI modela, a TPU 8i je optimiziran za fazu izvođenja, kada modeli odgovaraju na korisničke upite.
Google navodi da novi TPU‑ovi omogućuju i do tri puta brže treniranje u odnosu na prethodnu generaciju te oko 80 % bolje performanse po utrošenom dolaru. Mogu se povezati u golema klaster‑računala s više od milijun TPU‑ova u jednom sustavu.
Ipak, novi čipovi ne zamjenjuju Nvidijine GPU‑ove u Google Cloudu. Kako piše TechCrunch, Google će i dalje nuditi najnoviji Nvidijin hardver, uključujući nadolazeći čip Vera Rubin, te surađuje s Nvidijom na razvoju mrežnih tehnologija poput Falcona – softverski definiranog mrežnog sustava koji je Google 2023. otvorio kroz Open Compute Project.
Zašto je to važno
Na površini ovo izgleda kao sukob „Google protiv Nvidije“. U stvarnosti je to sukob „veliki oblaci protiv svih ostalih“.
TPU‑ovi postoje isključivo unutar Google Clouda. Svaka nova, efikasnija generacija produbljuje jaz između:
- korisnika koji prihvate Googlovu vlasničku platformu, i
- onih koji pokušavaju graditi AI na standardnom hardveru u vlastitim podatkovnim centrima ili kod manjih pružatelja oblaka.
Ako se pokaže da TPU 8 stvarno donosi do tri puta brže treniranje i 80 % bolje performanse po dolaru, ekonomija se dodatno naginje u korist hiperskalera. Za AI startupe u Zagrebu ili Ljubljani, za SaaS tvrtke u regiji i za korporativne IT odjele bit će sve teže opravdati kupnju i održavanje vlastitih GPU klastera.
Podjela na TPU 8t (treniranje) i 8i (izvođenje) strateški je važna jer treniranje i inference imaju potpuno različitu ekonomiju:
- treniranje je povremeno, skupo i rizično,
- izvođenje je stalno, predvidljivo i pod snažnim cjenovnim pritiskom.
Sa specijaliziranim čipovima Google može zasebno optimizirati i jedno i drugo: treniranje prodavati kao „premium“ kapacitet, a izvođenje kao masovnu, cjenovno učinkovitu uslugu. To znači više prostora za manevriranje s cijenama i maržama.
Kratkoročno, Nvidia ne gubi mnogo – Google i dalje masovno kupuje njezine GPU‑ove i s njom surađuje na boljem umrežavanju sustava. Dok god globalna potražnja za AI računanjem raste strmim tempom, Nvidia će prodavati sve što proizvede.
Pritisak se više osjeća kod:
- manjih oblaka i dobavljača on‑prem rješenja, koji nemaju šanse razvijati vlastite čipove,
- korisnika, koji danas dobivaju jeftiniju i bržu AI, ali za uzvrat prihvaćaju dublju ovisnost o jednoj kombinaciji čipova, API‑ja i alata.
Šira slika
TPU 8 pripada već jasno vidljivom trendu: hiperskalni pružatelji oblaka sve više vertikalno integriraju AI stog.
Amazon ima svoje čipove Trainium i Inferentia. Microsoft je predstavio akcelerator Maia i procesor Cobalt. Meta razvija vlastite čipove za preporučne sustave i generativnu AI. Svi oni paralelno kupuju ogromne količine Nvidijina hardvera.
Obrazac je sličan:
- Nvidia ostaje referenca i kompatibilnosna osnova – većina AI softvera i alata optimizirana je za to okruženje.
- Vlastiti čipovi se uvode ondje gdje najviše boli – kod najvećih treninga i masovnog izvođenja modela, gdje su računalni troškovi golem teret.
- Hardver se skriva iza upravljanih servisa – korisnici više ne kupuju GPU, nego „platformu za treniranje“, „vektorsku bazu“, „chat API“. Čip postaje interna implementacijska sitnica.
Sličnu evoluciju već smo gledali kod mrežne opreme i pohrane podataka: kad su se volumeni koncentrirali u oblaku, nastao je pritisak da se i hardver optimizira baš za te potrebe.
Za Nvidiju je rizik manje u ovom konkretnom proizvodu, a više u dugoročnom prebacivanju ravnoteže moći. Dok je potražnja veća od proizvodnih kapaciteta, sve izgleda idilično. No u trenutku kada se tržište normalizira, bit će važno koliki udio AI opterećenja u Amazonu, Googleu ili Microsoftu radi na njihovom vlastitom siliciju, a koliko na Nvidijinim GPU‑ovima.
Činjenica da Google i Nvidia zajedno razvijaju Falcon naglašava da ključan rov nije samo čip, nego cijeli sustav: mreža, interkonekti, softver, orkestracija, energetika. Tu se na kraju odlučuje tko može dugoročno nuditi jeftinu AI, a ipak ostati profitabilan.
Europski i regionalni kut
Za Europu i države EU, uključujući Hrvatsku, TPU 8 donosi i prilike i rizike.
Pozitivno: više i jeftinijeg AI računa u Google Cloudu olakšava život startupima u Zagrebu, Splitu ili Ljubljani, istraživačkim grupama na FER‑u ili PMF‑u te tvrtkama koje žele ugraditi napredne modele u svoje proizvode. To ide u smjeru ciljeva EU oko digitalne transformacije i programa poput Digitalna Europa.
Negativno: TPU‑ovi su dostupni isključivo u Googleovim podatkovnim centrima, izvan kontrole domaćih aktera. To nije u skladu s naglaskom na digitalni suverenitet, inicijativama poput GAIA‑X i s europskim Aktom o čipovima, koji upravo želi smanjiti ovisnost o trećim zemljama.
Regulatorni okvir dodatno kompliciraju GDPR, Akt o digitalnim uslugama (DSA), Akt o digitalnim tržištima (DMA) te nadolazeći EU Akt o umjetnoj inteligenciji. Svi oni naglašavaju transparentnost, prenosivost i mogućnost promjene pružatelja usluga.
Europski i regionalni pružatelji oblaka – od OVHclouda i Scalewaya do lokalnih data centara i telekoma – teško mogu konkurirati s vlastitim čipovima, pa se oslanjaju na standardne GPU‑ove. Ako Google agresivno iskoristi prednosti TPU‑a, razlika u cijenama može dodatno ojačati koncentraciju tržišta kod nekoliko globalnih igrača.
Za hrvatske tvrtke to znači realan izbor: prihvatiti jeftiniji i brži AI u američkom oblaku, uz veću ovisnost i potencijalne probleme s usklađenošću, ili platiti više za hibride i domaća rješenja koja nude veću kontrolu.
Pogled unaprijed
U sljedećih godinu do dvije ključna tema neće biti samo „tko ima brži čip“, nego „tko može ponuditi uvjerljiviji poslovni model“.
Vrlo je vjerojatno da će Google TPU 8t/8i koristiti za:
- agresivno snižavanje cijena treniranja i izvođenja za one koji pristanu na TPU,
- paketiranje AI‑a u servise više razine (plaćanje po tokenu, po zahtjevu, po funkcionalnosti),
- širenje dostupnosti TPU‑ova u EU regijama, kako bi privukao visoko regulirane sektore.
Na što bi hrvatske i regionalne organizacije trebale obratiti pažnju?
- Prenosivost modela – Koliko je lako premještati modele između Nvidijinih GPU‑ova (bilo u oblaku ili on‑premise) i TPU‑ova? Kakav je realan trošak zaključavanja u jedan ekosustav?
- Multi‑cloud alati – Podržavaju li MLOps platforme, orkestratori i otvoreni alati TPU kao ravnopravan cilj ili je to posebna, „googleovska“ staza?
- Primjenu EU regulative – Kako će se DMA i EU AI Act tumačiti u praksi kad je riječ o obvezama velikih oblaka da olakšaju prelazak korisnika i interoperabilnost?
Ni za Google rizici nisu mali. Ako potrošnja za AI usluge uspori ili ako kupci krenu ozbiljnije inzistirati na prenosivosti i otvorenim standardima, vrlo skupi programi razvoja čipova mogu postati teret. Istodobno, konkurentske inicijative – od europskih RISC‑V projekata do kineskih akceleratora – dugoročno mogu narušiti ekonomiju zatvorenih rješenja.
Nvidia će, s druge strane, vjerojatno još dugo imati pune narudžbenice. Prava prekretnica bit će trenutak kada udio radnih opterećenja na vlastitim čipovima hiperskalera počne ozbiljnije gristi njezin kolač.
Zaključak
Googlovi TPU 8t i 8i ne ruše Nvidiju, ali učvršćuju trend prema zatvorenim, vertikalno integriranim AI platformama pod kontrolom nekoliko globalnih oblaka. Korisnici kratkoročno dobivaju više snage za manje novca, a dugoročno plaćaju većom ovisnošću i manjom mogućnošću izbora.
Za hrvatske i regionalne tvrtke ključna će biti odluka: optimizirati za najnižu cijenu AI izračuna danas ili za slobodu da sutra bez bolova promijene dobavljača i arhitekturu?



