人形机器人必须服务多个行业才能成功

多功能性承诺及其复杂性

人形机器人的核心卖点是多功能性。原则上,形似人类的机器人可以在为人类设计的空间中运作——工厂、仓库、医院、零售店和家庭。与为固定安装中的单一任务优化的专业工业机器人不同,人形机器人可以跨不同任务和环境重新部署,通过软件而非物理改装来训练新的行为。

这个承诺对投资者和技术乐观主义者很有吸引力。但正如The Robot Report的分析所明确指出的那样,这也正是商业化困难的原因。同时处理多个应用需要开发工作的广度,这甚至会使资金充足的公司感到压力,而没有单个应用市场足够大来产生能够将成本降低到广泛可达水平的部署规模。

导航挑战

人形机器人必须在非结构化环境中解决导航问题——即不是为机器人运作而设计的空间,其中地板可能不平坦,物体放置方式不可预测,人类以需要动态响应的方式移动。这与工业机器人数十年来成功运作的受控环境从根本上不同。

当前最先进的人形系统已在受控演示和有限的试点部署中展示了令人印象深刻的导航能力。演示性能与在真实商业环境中进行连续、无监督运作所需的稳健性之间的差距仍然很大。跌倒、在新情况下的导航失败以及无法处理意外障碍物是在研究背景下可以接受但在生产力损失可测量的环境中商业上有问题的失败模式。

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 开源一套 2,000 小时机器人数据集

X Square Robot 发布了 XRZero-G0 和一套 2,000 小时的多模态数据集，旨在减少具身 AI 系统对真实机器人训练数据的需求。

Read article

操作:最难的问题

如果导航困难,操作更困难。人手拥有27个自由度和精妙的感觉反馈,能够以robotic manipulation系统尚未接近的可靠性和适应性来抓取和操作各种形状、大小、纹理和重量的物体。对于机器人必须处理多样化物体的应用——在电子商务履行中拣选、食品准备、复杂产品装配——操作能力是制约因素。

最先进的人形系统正在这方面取得真正的进展。具有多个关节手指的灵活手部、触觉传感阵列以及通过大规模reinforcement learning和从人类演示学习训练的操作策略的能力明显强于五年前可获得的任何东西。但商业部署的基准不是实验室性能——而是可靠的、无错误的运作,生产率与人工劳动力具有竞争力。这个基准仍然超过当前大多数操作任务的能力。

技能学习与转移

第三个发展前沿是技能学习:人形机器人获得新任务的速度有多快,以及学到的技能在不同机器人、环境和任务变化之间转移的速度有多快。这是软件定义的多功能性承诺被履行或落空的地方。

当前的学习范式需要大量的数据收集、训练计算和人类专家参与来教机器人新任务。机器人能够在几小时内从少数几次演示中学到新技能的愿景——类似于人工工作人员在一天内可以接受新任务培训的方式——在方向上是可实现的,但在生产复杂性下还没有可靠地实现。结合大规模预训练vision-language-action模型与特定任务快速微调的新兴方法显示了前景,但在生产条件下技能获取的可靠性和速度是一个活跃的研究挑战。

Anthropic呼吁强制审计，同时把AI重新定义为战略基础设施

Anthropic首席执行官Dario Amodei表示，透明度规则已不再足够，并呼吁对前沿AI系统进行强制性的第三方审计。

Read article

市场发展挑战

除了技术挑战外,人形机器人公司面临着真正新产品类别独有的市场发展挑战。不存在既定的部署手册。将人形机器人集成到现有设施中需要还未标准化的安全协议、劳动力适应、监管合规性和工作流程重新设计。每个早期部署在某种程度上都是一个定制工程项目,而不是产品销售。

成功应对这一转变的公司——建立可重复的部署方法、培训认证集成商以及积累改进系统性能的运营数据——将创建超越其核心机器人硬件和软件的持久竞争优势。人形机器人的商业化竞赛就像构建部署生态系统一样与个体系统的能力有关,而赢得那场竞赛的获胜者可能不是构建最技术先进机器人的公司。

本文基于The Robot Report的报道。阅读原文。

Originally published on therobotreport.com

人形机器人必须同时应对多个行业才能成功