Boston Dynamics 使用 Gemini 让 Spot 更智能

一则小公告，却对机器人领域有着重大意义

Boston Dynamics 表示，正在使用 Google DeepMind 的 Gemini 让 Spot 变得更智能。该公司将这一模型描述为帮助 AIVI-Learning 提升推理能力与适应性的方式。所提供的原始文本很简短，但战略方向十分明确。全球最具辨识度的机器人公司之一，正在推动机器人能力超越运动与控制，迈向能够更灵活理解情境的系统。

这一点很重要，因为机器人长期以来擅长结构化任务，却在复杂混乱的环境中表现吃力。只要环境可预测、规则固定、可选动作范围有限，机器人就能表现得极为可靠。但当条件发生变化、指令变得模糊，或者机器必须在没有严格脚本的情况下决定下一步该做什么时，挑战就开始了。因此，在这一语境下，“推理”和“适应性”并不是营销层面的附加词，而是指向该领域最棘手、尚未解决的工程难题之一。

Spot 尤其适合承担这种转变。四足机器人本就因能在对人类而言困难或危险的空间中移动而著称，它的价值不仅在于走得好，更在于理解自己看到的是什么，以及应该如何回应。如果 Gemini 真能按照 Boston Dynamics 所说的方式改进 AIVI-Learning，那么收益就不会只体现在更自然的语言交互上，而是在于让机器人在真实环境中的行为不那么脆弱。

“推理”在实践中意味着什么

在机器人领域，更强的推理不一定意味着人类意义上的抽象智能。它可以表现为更有效地把感知与行动连接起来。机器人可能需要解读场景、判断哪些信息重要、在多个任务之间做出选择，并在环境变化时及时调整。即便这条链路上的进步幅度不大，也能显著提升系统实用性，因为它减少了对持续人工监督和预设应对方案的依赖。

适应性同样具有很强的实践意义。只能在精心准备环境中工作的机器人，其经济适用范围是有限的。能够应对布局、照明、障碍物或指令变化的机器人，则可以进入更苛刻的工业和现场部署场景。这也是这里这项合作值得注意的原因。Boston Dynamics 提供硬件、运动能力和部署经验；Gemini 则被定位为可提升理解与决策的一层能力。

公告中对 AIVI-Learning 的强调也暗示了一个更广泛的趋势。机器人公司越来越需要能够学习并泛化的系统，而不仅仅是执行命令。传统自动化依然强大，但往往依赖费时费力的配置。AI 辅助方法的目标，是缩短这种准备时间，并让机器人把有用的行为从一个场景迁移到另一个场景。至少这是其承诺所在，而这项承诺至今行业仍未真正兑现。

阿里巴巴借 Qwen3.7-Plus 发布推进 agentic AI

阿里巴巴推出了 Qwen3.7-Plus，这是一款多模态模型，旨在在单一 agent 循环中实现视觉识别、点击、编码以及在软件内操作，表明其正更明确地转向自主 AI 系统。

Read article

为什么这项合作符合行业方向

机器人行业正在朝着物理系统与大型 AI 模型更紧密融合的方向发展。其吸引力很容易理解。基础模型已经证明，它们能够在大规模范围内处理语言、图像和模式识别；而物理机器人仍然需要更好的方式，把这种广泛能力转化为可靠行动。将两者结合是显而易见的下一步，即便理解与执行之间的技术鸿沟依然巨大。

Boston Dynamics 也并非从零开始。其机器人早已因出色的运动能力和精致的自主性演示而闻名。但仅有机动能力并不能造就通用机器。真正有用的自主性，需要对目标、上下文和例外情况作出判断。这正是一个被描述为能提升推理与适应性的模型，如果表现足够好，可能产生巨大影响的地方。

不过，约束条件同样不能忽视。物理系统对稳健性的要求，往往远高于软件产品。聊天机器人给出一个别扭的回答，尚可被原谅；而在人员、设备或不平整地形周围运行的机器人，一旦误读情境，就没那么容易被原谅。因此，AI 赋能机器人领域的每一次进展，都不能只看新奇程度，还必须看一致性、安全性，以及出错后的恢复能力。

接下来要看什么

如今最关键的问题，不是 AI 模型会不会与机器人连接起来。事实上，这件事在整个行业已经发生。真正的问题是，这种整合究竟能带来多少实际能力提升。Boston Dynamics 表示，Gemini 将通过 AIVI-Learning 改进 Spot 的推理能力和适应性。下一项验证点将是，这些改进是否会体现在演示之外真正重要的任务中：巡检、导航、与操作员互动，以及在不断变化环境中的运行。

如果这些能力兑现，这项公告就会被视作机器人领域更大转折的一部分；如果没有兑现，它仍然反映出行业的一项共识，那就是更好的感知和更好的语言能力本身还不够。机器人需要在决策环节具备更强能力。无论如何，Boston Dynamics 选择 Gemini，凸显了竞争压力正在向哪里集中：不仅是制造移动表现惊人的机器，更是制造能够更有效决定“究竟需要怎样移动”的机器。

这正是现代机器人最可能决定成败的艰难中间地带。硬件能力能把机器人带进房间，而推理与适应性决定了它到了那里之后，能否做出真正有价值的事情。

本文基于 The Robot Report 的报道。阅读原文。

Originally published on therobotreport.com

Boston Dynamics 采用 Gemini，推动 Spot 朝更强推理能力迈进

一则小公告，却对机器人领域有着重大意义

“推理”在实践中意味着什么

阿里巴巴借 Qwen3.7-Plus 发布推进 agentic AI

为什么这项合作符合行业方向

接下来要看什么

Comments (0)

Keep Reading