Google 和 Nvidia 通过新的云方案瞄准 AI 推理成本

AI 的下一个瓶颈不再只是训练

Google 和 Nvidia 借助 Google Cloud Next 聚焦了一个正在迅速进入 AI 商业核心的问题：推理成本。根据候选提要，这两家公司概述了一项旨在应对大规模 AI 模型服务成本的硬件路线图，其中包括新的 A5X 裸金属实例。

即便只是摘要形式，这一强调重点的变化也很有意义。在过去几年里，AI 基础设施讨论很大一部分都围绕着训练越来越大的模型展开。但一旦系统进入生产阶段，推理就会成为持续性的运营支出。每当用户提交提示词、应用调用模型，或智能体再进行一轮推理时，都会产生这笔成本。

为什么推理经济性如今如此重要

AI 产品要么在这里成为可行的生意，要么仍只是昂贵的演示。实验室可以为高昂的训练成本找到理由，只要最终模型在战略上足够重要。然而，云客户需要的是能在日常运营中成立的经济模型。更低的服务成本可以扩大利润率、支持更便宜的产品，或让性能目标更具进取性。

这就是此类基础设施公告具有战略分量的原因。Google 和 Nvidia 不只是交付更多硬件，他们是在解决一个影响整个技术栈采用的约束，从面向消费者的聊天机器人到企业副驾驶，再到工业自动化系统。

云端竞争正在演变为效率竞争

提要明确指出，这一路线图是在 Google Cloud Next 上发布的，目标是应对“at scale”的推理成本。这个表述很关键，因为云 AI 竞争不再只是围绕加速器的可获得性。竞争也在于这些加速器能以多高效率被部署、调度，并通过与真实工作负载相匹配的实例提供给客户。

提到 A5X 裸金属实例表明，Google 正在瞄准那些希望对高性能基础设施拥有更直接控制权的客户。对于大型 AI 部署而言，裸金属产品很重要，因为它们减少了软件与硬件之间的层级，可能提升性能并增强调优灵活性。所给文本没有提供完整技术细节，因此不宜宣称具体收益。但其定位很清楚：这是面向严肃生产级推理的基础设施。

AI 下一阶段的信号

这项公告更广泛的意义在于，AI 基础设施正在进入一个更讲究纪律的阶段。第一波浪潮关注的是能力，下一波则关注经济性。公司仍然希望模型更强，但它们也需要足够便宜、足够稳定，能够支撑规模化服务的系统。

因此，降低推理成本值得作为重大行业新闻来关注。它指向超大规模云厂商认为客户痛点最强的地方，也暗示了企业 AI 未来的赢家可能如何分化：不仅看原始模型质量，还看能否在生产中以可负担的方式提供这种质量。

Google 和 Nvidia 正在押注市场已经准备好接受这一信息，而越来越多的证据表明，他们的判断是对的。

本文基于 AI News 的报道。阅读原文。

Google 和 Nvidia 将推理成本置于其云 AI 方案的核心

AI 的下一个瓶颈不再只是训练

为什么推理经济性如今如此重要

云端竞争正在演变为效率竞争

Keep Reading

为什么 Nvidia 仍然处于核心位置

Reliable Robotics 融资1.6亿美元，推进自动驾驶飞机迈向 FAA 认证

AI 下一阶段的信号

Comments (0)

霍尼韦尔将退出仓储自动化业务，并与 American Industrial Partners 达成交易