Google Coral Board 可本地运行 Gemma 3

Google 正将本地 AI 带到更小的形态尺寸

Google 推出了一款新的 Coral Board，旨在直接在紧凑型设备上运行 AI 工作负载，而不是把这些任务发送回云端。该开发板在 Google I/O 上亮相，围绕公司的 Coral 生态系统打造，面向耳机、AR 眼镜和智能手表等产品；在这些产品中，延迟、连接性和功耗限制使端侧处理显得尤为重要。

最引人注目的说法很直接：Google 表示，这块开发板可以完全在本地运行其开源的 Gemma 3 270M 语言模型。这让这款硬件的意义更多体现在它所代表的方向，而非纯粹的规模。边缘 AI 过去常常受限于分散的加速器、紧张的内存预算，以及把有用模型塞进小型系统的现实难题。Google 将 Coral Board 描绘为对这一问题更连贯的解决方案。

硬件包含什么

这块开发板的核心是一颗 Synaptics Astra SL2619 芯片，配备 2 GHz 双核处理器、2 GB 内存和 1 TOPS 算力。Google 还表示，开发板包含 Coral NPU，这是一款基于 RISC-V 架构、由 Google Research 开发的开源机器学习单元。

这些规格将这款设备放在一个更看重效率和集成而非头条性能的类别中。Google 并不是把它定位为桌面级 AI 机器，而是将其定位为面向开发者的构建模块，帮助需要在设备本地解释音频、视觉或文本的硬件实现功能。

How we used Gemini to build Google I/O 2026

谷歌披露 Gemini 如何助力 I/O 2026 的制作

谷歌表示，团队借助 Gemini 和其他 AI 工具帮助制作 Google I/O 2026 的影片、视觉内容和活动元素，将这场大会呈现为 AI 辅助制作的内部示范。

Read article

为什么本地推理很重要

在本地运行 Gemma 3 意味着设备可以在没有持续云连接的情况下处理部分任务。这能够降低延迟、提升响应速度，并减少对网络稳定性的依赖。它也会改变某些应用的成本结构，因为每次用户说话、做手势或请求翻译时，推理都不必被路由到远程服务。

Google 自身的演示也指向了这一方向。在 I/O 上，公司展示了实时翻译、语音控制硬件，以及一个生成式音乐方案，其中 YOLOv8 视觉模型追踪水母的运动并将其转化为音乐。所有这些例子都旨在说明，这块开发板不仅适合模型演示，也适合将传感器、推理和输出实时结合起来的交互式系统。

试图减少加速器碎片化

Google 描述中较有意思的一点，是其将这块开发板定位为解决 AI 加速器碎片化问题的办法。对开发者来说，这确实是一个现实障碍，尤其是在可穿戴设备、智能设备和嵌入式系统等品类中。模型理论上可能放得下，但真正部署时往往会被不兼容的工具链、硬件怪癖以及有限的厂商支持拖住。

通过将开源 NPU 路线与一个已知的模型家族以及公开演示组合在一起，Google 似乎想让边缘端技术栈显得更完整。这并不能消除热设计限制、电池续航或内存上限等棘手权衡，但它确实表明，公司正更认真地推动本地 AI 从展示性功能变成可重复的开发路径。

研究发现，AI 编码代理在社会科学中的使用差异极大

Anthropic 的一项研究发现，社会科学领域对编码代理的采用存在巨大差异，差异体现在性别、学科、职业阶段和大学排名上。

Read article

这对开发者意味着什么

这块开发板预计将于今年夏天发货，不过 Google 尚未公布价格。这留下了一个最关键的现实问题。小型设备 AI 硬件必须足够便宜、足够易获取，也足够容易编程，才能真正走出原型阶段。

尽管如此，这款产品仍然说明了边缘 AI 的发展方向。就在一年前，许多人对 AI 硬件的讨论几乎完全聚焦于大型集群和数据中心。那一部分市场仍然占主导地位。但 Google 这块新开发板提醒人们，AI 建设还有另一个前线：为小型设备赋予足够的本地智能，让它们在不持续依赖云端推理的情况下，变得更自主、更实用。

亮点

Gemma 3 270M 可在开发板上本地运行，无需云端支持。
这款硬件面向眼镜、耳机和可穿戴设备等紧凑型产品。
Google 将这块开发板定位为减少边缘 AI 开发中加速器选择碎片化的一种方式。

如果该平台价格合理且软件栈稳定，Coral Board 可能不只是一个演示单元。它或许会标志着 AI 走进日常设备、而不是总要“回家”调用云推理的一个实际步骤。

本文基于 The Decoder 的报道。阅读原文。

Originally published on the-decoder.com

Google 的 Coral Board 将小型设备 AI 更进一步推向边缘端

Google 正将本地 AI 带到更小的形态尺寸

硬件包含什么

谷歌披露 Gemini 如何助力 I/O 2026 的制作

为什么本地推理很重要

试图减少加速器碎片化

研究发现，AI 编码代理在社会科学中的使用差异极大

这对开发者意味着什么

亮点

Comments (0)

Related Articles

MISUMI以10亿美元AI制造押注启动美洲扩张

Keep Reading