Google发布TPU 8i和TPU 8t，面向agentic AI工作负载

Google正在将其TPU策略分拆为推理和训练两条线

Google推出了两种专门化的第八代TPU设计，并认为AI基础设施的下一阶段将由能够推理、规划并执行多步骤任务的自主智能体塑造。在Google博客的一篇文章中，公司表示，TPU 8i是专门为帮助AI智能体更快完成工作而打造的，以维持良好的用户体验；而TPU 8t则针对训练进行了优化，能够在单一庞大内存池上运行高度复杂的模型。

这项发布之所以引人注目，不仅因为Google在推出新芯片，更因为它明确地围绕一种新的工作负载叙事来组织这些芯片。多年来，围绕AI加速器的讨论一直聚焦于训练和推理之间的经典分工。Google保留了这一区分，但将推理端的一部分重新定义为围绕智能体，而不是传统的模型服务。这种表述表明，公司认为未来需求将不再主要取决于孤立的提示-响应交互，而是更依赖于代表用户执行一系列操作的系统。

为什么需要两款专用TPU

Google的描述指向一个简单前提：agentic AI的基础设施需求并不等同于前沿模型训练的需求。智能体需要响应速度。如果它们要对任务进行推理、调用工具并完成工作流，那么延迟就会成为体验是否有用的关键因素。Google认为，这正是TPU 8i的定位。它被设计为让这些交互足够快速，以支持实际部署。

TPU 8t则解决另一个问题。训练先进模型越来越不仅需要原始算力，还需要能够容纳更大、更复杂系统的内存容量。Google表示，TPU 8t针对这一角色进行了调校，并且可以在单一庞大的内存池上运行非常复杂的模型。这一说法将该芯片定位为开发者和机构的工具，帮助他们在不过度分散基础设施负载的情况下推进规模化。

更广泛的技术栈也是信息的一部分

Google同样谨慎地将这些芯片放入其完整基础设施叙事中。博客文章将新TPU与网络、数据中心以及高能效运维联系起来，并将这一更广泛的系统描述为能够把高度响应的agentic AI带给大众的引擎。这种表述很重要，因为AI基础设施领域的竞争焦点已不再只是芯片本身，而是把硅片、软件、网络和电力效率整合成一个可大规模采购和部署的平台。

对Google而言，这是其长期强调的一项战略优势。公司卖的不只是加速器接入，而是在展示一个纵向整合的环境，其中定制芯片与云服务相结合，并叠加多年运行大规模机器学习系统所积累的内部运营经验。

“agentic”在实践中意味着什么

“agentic时代”这一说法本身就很有信息量。AI公司越来越多地推广那些不仅能按需生成文本或图像的系统。目标是让软件能够跨多个步骤进行规划、决策和执行，通常还可以接入工具或企业工作流。无论每一个被包装为“智能体”的产品是否都符合这一描述，基础设施提供商显然都把这一类别视为足够重要，值得据此规划硬件路线图。

通过将TPU 8i命名为面向智能体的芯片，Google实际上是在押注：复杂、多阶段工作负载下的响应速度将成为一个决定性的性能指标。这个指标的重要性可能不亚于峰值基准分数。因为在真实使用中，如果一个智能体反应迟缓，或在链式任务中卡住，即使底层模型很强，也会显得像出了问题。

为什么这次发布重要

这次公告再次表明，在经历了一段以通用GPU需求主导讨论的时期后，AI硬件正在迅速重新走向专门化。市场如今正围绕不同需求分化：训练巨型模型、以低成本提供模型服务、处理多模态工作负载，以及支持交互式智能体系统。Google的新一对TPU反映了这种碎片化趋势。

它也说明基础设施层面的叙事已经发生变化。芯片发布不再只是围绕速度提升或吞吐量增长来包装，而是与AI将如何被使用的具体愿景绑定在一起。在这种情况下，Google希望客户设想一个由智能体代表用户行动的世界，并且其底层基础设施是专为这些系统的训练和快速实时执行而打造的。

如果这一愿景被证明正确，那么TPU 8i和TPU 8t就不只是一次常规的代际更新，而是关于AI需求下一步走向的架构声明。

本文基于Google AI Blog的报道。阅读原文。

Originally published on blog.google

Google推出两种第八代TPU设计，面向“agentic”AI时代

Google正在将其TPU策略分拆为推理和训练两条线

为什么需要两款专用TPU

更广泛的技术栈也是信息的一部分

“agentic”在实践中意味着什么

为什么这次发布重要

Comments (0)

Keep Reading