
Google y Nvidia sitúan los costos de inferencia en el centro de su propuesta de IA en la nube
En Google Cloud Next, Google y Nvidia esbozaron planes de infraestructura orientados a reducir el costo de la inferencia de IA a gran escala, destacando cómo la economía de servir modelos se está convirtiendo en un campo de batalla principal.
- Google y Nvidia destacaron la reducción del costo de inferencia de IA en Google Cloud Next.
- La hoja de ruta incluye instancias bare-metal A5X.













