
Google e Nvidia colocam os custos de inferência no centro de sua proposta de IA em nuvem
No Google Cloud Next, Google e Nvidia detalharam planos de infraestrutura voltados a reduzir o custo da inferência de IA em escala, destacando como a economia de servir modelos está se tornando um campo de batalha central.
- Google e Nvidia destacaram a redução do custo de inferência de IA no Google Cloud Next.
- O roadmap inclui instâncias bare-metal A5X.













