La demande de jetons devient exponentielle

Nvidia a une fois de plus réécrit les livres de records. Le fabricant de puces a enregistré une nouvelle performance trimestrielle record, propulsée par ce que le PDG Jensen Huang a décrit comme une augmentation sans précédent de la demande d'infrastructure informatique d'IA. « La demande de jetons dans le monde est devenue complètement exponentielle », a déclaré Huang lors de l'annonce des résultats, présentant les résultats financiers extraordinaires de l'entreprise comme une conséquence naturelle d'un changement fondamental dans la manière dont l'économie mondiale consomme la puissance de calcul.

Ces résultats prolongent la remarquable ascension de Nvidia en tant que principal bénéficiaire de la construction d'infrastructures d'IA. Alors que les entreprises de tous les secteurs se précipitent pour déployer des capacités d'IA — des fournisseurs de cloud formant des modèles de pointe aux entreprises construisant des pipelines d'inférence — l'activité de GPU de centre de données de Nvidia est devenue le cœur battant d'un cycle de dépenses d'investissement sans précédent dans l'industrie technologique.

Le supercycle des dépenses d'investissement continue

Le trimestre record de Nvidia intervient dans un contexte d'engagements historiques de dépenses d'investissement de la part des plus grandes entreprises technologiques mondiales. Les hyperscalers, notamment Microsoft, Google, Amazon et Meta, ont collectivement promis des centaines de milliards de dollars en dépenses d'infrastructure d'IA, une grande partie de cet investissement allant directement dans l'activité GPU de centre de données de Nvidia.

L'ampleur des dépenses a suscité un scepticisme récurrent de la part des investisseurs et des analystes qui se demandent si le retour sur investissement peut justifier de telles dépenses énormes. Pourtant, trimestre après trimestre, les principaux fournisseurs de cloud ont non seulement maintenu, mais accéléré leurs plans de dépenses d'investissement, suggérant que les signaux de demande internes et les métriques d'adoption des clients continuent de valider la thèse d'investissement.

La récente annonce par Meta d'un accord massif sur les puces avec AMD — survenant quelques jours seulement après l'engagement de millions de GPU Nvidia — illustre que la demande de calcul d'IA est si intense que même les plus grands acheteurs diversifient leur base de fournisseurs plutôt que de choisir entre les fournisseurs de puces. Le marché de l'infrastructure d'IA est devenu suffisamment grand pour soutenir plusieurs gagnants simultanément.

Au-delà de la formation : l'opportunité d'inférence

Alors qu'une grande partie du cycle initial des dépenses d'investissement en IA était motivée par les énormes exigences de calcul de la formation de modèles de pointe, une part croissante de la demande de GPU provient désormais de l'inférence — le processus d'exécution réelle des modèles entraînés pour répondre aux demandes des utilisateurs. Alors que les applications d'IA passent des laboratoires de recherche au déploiement en production desservant des millions d'utilisateurs, l'empreinte de calcul d'inférence se développe rapidement.

Ce changement est particulièrement important pour Nvidia, car les charges de travail d'inférence représentent un moteur de demande potentiellement plus important et plus soutenu que la formation. La formation d'un modèle est une dépense d'investissement ponctuelle, bien qu'énorme. L'inférence, en revanche, génère une demande de calcul continue qui évolue avec l'utilisation. À mesure que davantage d'applications intègrent des capacités d'IA et que l'adoption par les utilisateurs augmente, la demande d'inférence se compose de manière que la formation ne peut pas.

La référence de Huang à la demande exponentielle de jetons reflète directement cette dynamique. Chaque réponse de chatbot alimentée par l'IA, chaque complétion de code, chaque génération d'images et chaque flux de travail d'automatisation d'entreprise consomme des jetons qui nécessitent la puissance de calcul des GPU pour être produits. Plus l'IA est intégrée dans les interactions numériques quotidiennes, plus le monde consomme de jetons, et plus les GPU sont nécessaires pour les produire.

Le paysage concurrentiel

Malgré sa position dominante sur le marché, Nvidia fait face à un environnement de plus en plus concurrentiel. AMD gagne du terrain avec ses accélérateurs de la série MI, comme en témoigne le récent engagement d'achat de plusieurs milliards de dollars de Meta. Les puces personnalisées des principaux fournisseurs de cloud — y compris les TPU de Google, les puces Trainium d'Amazon et les accélérateurs Maia de Microsoft — représentent un autre vecteur de concurrence, car les hyperscalers cherchent à réduire leur dépendance à l'égard d'un seul fournisseur.

Nvidia a maintenu son avance grâce à une combinaison de performances matérielles, de l'écosystème logiciel CUDA qui crée des coûts de changement significatifs, et d'une cadence de produits rapide qui a permis aux concurrents de toujours courir après la génération précédente. Les futures architectures Blackwell Ultra et Rubin de l'entreprise sont conçues pour maintenir ce leadership en matière de performance lors de la prochaine génération de mise à l'échelle de l'IA.

Ce que les chiffres signifient pour l'industrie de l'IA

La performance record continue de Nvidia sert de baromètre pour la santé et la trajectoire de l'industrie de l'IA au sens large. La croissance des revenus de l'entreprise reflète directement le rythme auquel les organisations convertissent leurs ambitions en IA en investissements concrets en infrastructure. Tant que Nvidia continuera d'enregistrer des records, le signal est clair : la construction d'infrastructures d'IA s'accélère, et non ne stagne.

Pour le secteur technologique et l'économie en général, la question n'est plus de savoir si les dépenses d'infrastructure d'IA se poursuivront — elles se poursuivront clairement — mais si les applications et les flux de revenus construits sur cette infrastructure généreront éventuellement des rendements qui justifieront l'investissement. Les résultats financiers de Nvidia suggèrent que les entreprises les plus proches du silicium sont convaincues que la réponse est oui. Le reste de l'industrie travaille encore à le prouver.

Cet article est basé sur un reportage de TechCrunch. Lire l'article original.