Poptávka po tokenech exponenciálně roste

Nvidia opět přepsala rekordní knihy. Výrobce čipů vykázal další rekordní čtvrtletní výkon, poháněný tím, co generální ředitel Jensen Huang popsal jako bezprecedentní nárůst poptávky po infrastruktuře pro výpočty AI. „Poptávka po tokenech ve světě se stala zcela exponenciální,“ prohlásil Huang během oznámení výsledků a rámoval mimořádné finanční výsledky společnosti jako přirozený důsledek zásadní změny ve způsobu, jakým globální ekonomika spotřebovává výpočetní výkon.

Výsledky prodlužují pozoruhodný běh společnosti Nvidia jako primárního příjemce budování infrastruktury AI. Jak společnosti napříč všemi sektory závodí v nasazování schopností AI – od poskytovatelů cloudu trénujících špičkové modely po podniky budující inferenční pipeline – byznys datových center GPU společnosti Nvidia se stal tepajícím srdcem cyklu kapitálových výdajů, jaký technologický průmysl dosud nezažil.

Supercyklus kapitálových výdajů pokračuje

Rekordní čtvrtletí společnosti Nvidia přichází na pozadí historických závazků kapitálových výdajů ze strany největších technologických společností na světě. Hyperscaleři, včetně společností Microsoft, Google, Amazon a Meta, kolektivně přislíbili stovky miliard dolarů na výdaje na infrastrukturu AI, přičemž velká část této investice směřuje přímo do byznysu datových center GPU společnosti Nvidia.

Rozsah výdajů vyvolal opakovaný skepticismus ze strany investorů a analytiků, kteří zpochybňují, zda návratnost investic může ospravedlnit tak obrovské výdaje. Přesto čtvrtletí za čtvrtletím hlavní poskytovatelé cloudu nejen udržují, ale i zrychlují své plány kapitálových výdajů, což naznačuje, že interní signály poptávky a metriky adopce zákazníků nadále potvrzují investiční tezi.

Nedávné oznámení společnosti Meta o masivní dohodě o čipech se společností AMD – která přišla jen několik dní po závazku k milionům GPU Nvidia – ilustruje, že poptávka po výpočetní síle AI je tak intenzivní, že i největší kupující diverzifikují svou dodavatelskou základnu, místo aby si vybírali mezi dodavateli čipů. Trh s infrastrukturou AI se stal dostatečně velký, aby současně podporoval více vítězů.

Za tréninkem: Inferenční příležitost

Zatímco velkou část počátečního cyklu kapitálových výdajů na AI poháněly obrovské výpočetní požadavky na trénování špičkových modelů, rostoucí podíl poptávky po GPU nyní pochází z inferencí – procesu skutečného spouštění natrénovaných modelů pro obsluhu požadavků uživatelů. Jak se aplikace AI přesouvají z výzkumných laboratoří do produkčního nasazení obsluhujícího miliony uživatelů, výpočetní stopa pro inference se rychle rozšiřuje.

Tato změna je pro společnost Nvidia obzvláště významná, protože inferenční zátěže představují potenciálně větší a udržitelnější hnací sílu poptávky než trénink. Trénink modelu je jednorázový kapitálový výdaj, i když obrovský. Naproti tomu inference generuje neustálou poptávku po výpočetní síle, která se škáluje s využitím. Jak více aplikací začleňuje schopnosti AI a roste adopce uživatelů, poptávka po inferencích se skládá způsoby, které trénink nemůže.

Odkaz Jense Huang na exponenciální poptávku po tokenech přímo odráží tuto dynamiku. Každá odpověď chatbotu poháněná AI, dokončení kódu, generování obrázků a pracovní postup automatizace podniků spotřebovává tokeny, které k jejich produkci vyžadují výpočetní výkon GPU. Čím více se AI stává součástí každodenních digitálních interakcí, tím více tokenů svět spotřebuje a tím více GPU je potřeba k jejich produkci.

Konkurenční prostředí

Navzdory své dominantní pozici na trhu čelí Nvidia stále konkurenčnějšímu prostředí. AMD získává na síle se svými akcelerátory řady MI, což dokazuje nedávný závazek společnosti Meta k nákupu v hodnotě několika miliard dolarů. Vlastní čipy od hlavních poskytovatelů cloudu – včetně TPU od Google, čipů Trainium od Amazonu a akcelerátorů Maia od Microsoftu – představují další vektor konkurence, protože hyperscaleři hledají snížení své závislosti na jediném dodavateli.

Nvidia si udržuje své vedení díky kombinaci výkonu hardwaru, softwarového ekosystému CUDA, který vytváří významné náklady na přechod, a rychlé produktové kadenci, která udržuje konkurenty neustále dohánějící předchozí generaci. Nadcházející architektury Blackwell Ultra a Rubin společnosti jsou navrženy tak, aby udržely toto výkonnostní vedení prostřednictvím další generace škálování AI.

Co čísla znamenají pro průmysl AI

Pokračující rekordní výkon společnosti Nvidia slouží jako barometr zdraví a trajektorie širšího průmyslu AI. Růst příjmů společnosti přímo odráží tempo, jakým organizace převádějí ambice AI na konkrétní investice do infrastruktury. Dokud Nvidia nadále zaznamenává rekordy, signál je jasný: budování AI se zrychluje, nikoli stagnuje.

Pro technologický sektor a ekonomiku jako celek již otázkou není, zda výdaje na infrastrukturu AI budou pokračovat – jasně že budou – ale zda aplikace a příjmové toky postavené na této infrastruktuře nakonec vygenerují výnosy, které investici ospravedlní. Finanční výsledky společnosti Nvidia naznačují, že společnosti nejblíže k čipu jsou si jisté, že odpověď je ano. Zbytek průmyslu na tom stále pracuje.

Tento článek vychází z reportáže TechCrunch. Přečtěte si původní článek.