Google 正将本地 AI 带到更小的形态尺寸
Google 推出了一款新的 Coral Board,旨在直接在紧凑型设备上运行 AI 工作负载,而不是把这些任务发送回云端。该开发板在 Google I/O 上亮相,围绕公司的 Coral 生态系统打造,面向耳机、AR 眼镜和智能手表等产品;在这些产品中,延迟、连接性和功耗限制使端侧处理显得尤为重要。
最引人注目的说法很直接:Google 表示,这块开发板可以完全在本地运行其开源的 Gemma 3 270M 语言模型。这让这款硬件的意义更多体现在它所代表的方向,而非纯粹的规模。边缘 AI 过去常常受限于分散的加速器、紧张的内存预算,以及把有用模型塞进小型系统的现实难题。Google 将 Coral Board 描绘为对这一问题更连贯的解决方案。
硬件包含什么
这块开发板的核心是一颗 Synaptics Astra SL2619 芯片,配备 2 GHz 双核处理器、2 GB 内存和 1 TOPS 算力。Google 还表示,开发板包含 Coral NPU,这是一款基于 RISC-V 架构、由 Google Research 开发的开源机器学习单元。
这些规格将这款设备放在一个更看重效率和集成而非头条性能的类别中。Google 并不是把它定位为桌面级 AI 机器,而是将其定位为面向开发者的构建模块,帮助需要在设备本地解释音频、视觉或文本的硬件实现功能。
为什么本地推理很重要
在本地运行 Gemma 3 意味着设备可以在没有持续云连接的情况下处理部分任务。这能够降低延迟、提升响应速度,并减少对网络稳定性的依赖。它也会改变某些应用的成本结构,因为每次用户说话、做手势或请求翻译时,推理都不必被路由到远程服务。
Google 自身的演示也指向了这一方向。在 I/O 上,公司展示了实时翻译、语音控制硬件,以及一个生成式音乐方案,其中 YOLOv8 视觉模型追踪水母的运动并将其转化为音乐。所有这些例子都旨在说明,这块开发板不仅适合模型演示,也适合将传感器、推理和输出实时结合起来的交互式系统。
试图减少加速器碎片化
Google 描述中较有意思的一点,是其将这块开发板定位为解决 AI 加速器碎片化问题的办法。对开发者来说,这确实是一个现实障碍,尤其是在可穿戴设备、智能设备和嵌入式系统等品类中。模型理论上可能放得下,但真正部署时往往会被不兼容的工具链、硬件怪癖以及有限的厂商支持拖住。
通过将开源 NPU 路线与一个已知的模型家族以及公开演示组合在一起,Google 似乎想让边缘端技术栈显得更完整。这并不能消除热设计限制、电池续航或内存上限等棘手权衡,但它确实表明,公司正更认真地推动本地 AI 从展示性功能变成可重复的开发路径。
这对开发者意味着什么
这块开发板预计将于今年夏天发货,不过 Google 尚未公布价格。这留下了一个最关键的现实问题。小型设备 AI 硬件必须足够便宜、足够易获取,也足够容易编程,才能真正走出原型阶段。
尽管如此,这款产品仍然说明了边缘 AI 的发展方向。就在一年前,许多人对 AI 硬件的讨论几乎完全聚焦于大型集群和数据中心。那一部分市场仍然占主导地位。但 Google 这块新开发板提醒人们,AI 建设还有另一个前线:为小型设备赋予足够的本地智能,让它们在不持续依赖云端推理的情况下,变得更自主、更实用。
亮点
- Gemma 3 270M 可在开发板上本地运行,无需云端支持。
- 这款硬件面向眼镜、耳机和可穿戴设备等紧凑型产品。
- Google 将这块开发板定位为减少边缘 AI 开发中加速器选择碎片化的一种方式。
如果该平台价格合理且软件栈稳定,Coral Board 可能不只是一个演示单元。它或许会标志着 AI 走进日常设备、而不是总要“回家”调用云推理的一个实际步骤。
本文基于 The Decoder 的报道。阅读原文。
Originally published on the-decoder.com



