ロボット工学におけるデータの問題

ロボットに物理的世界でオブジェクトを操作することを教えることは、歴史的には人間が収集した膨大な量のデモンストレーションデータを必要としてきました。Google DeepMindのRT-1システムは、17ヶ月間に人間のオペレータによって収集された130,000エピソードのデータが必要でした。DROIDデータセットには、13の研究機関で収集された76,000の遠隔操縦軌跡が含まれており、約350時間の人間の努力を表しています。これらの数字は、課題の規模だけでなく、それが生み出す経済的な集中を反映しています。資金が豊富なラボのみが、競争力のある操作システムを訓練するために必要なデータを収集する余裕があります。

Allen Institute for AI — Ai2 — は、MolmoBotで異なるモデルを提案しています。物理的なデモンストレーションではなく、主に仮想シミュレーションからのデータで訓練されたロボット操作システムです。この研究は、このシミュレーションで訓練されたモデルが、その機能を実際の物理的なロボットシステムに転送できることを示しており、能力のあるロボット操作AIへのアクセスを大幅に民主化することができる結果です。

シミュレーションが歴史的に転送に失敗した理由

シミュレーションパフォーマンスと現実世界のパフォーマンスの間のギャップ — 「シミュレーション・ツー・リアルギャップ」 — は持続的な障害です。物理的なロボットは、豊富な感覚入力、環境的な可変性、およびシミュレーション環境が忠実に複製するのに苦労する接触動力学に遭遇します。シミュレーション全体で訓練されたロボットは、その訓練環境が抽象化した現実世界の複雑さを処理しないことがよくあります。

このギャップを埋めるための以前の試みは、ドメイン・ランダミゼーション — 照明、オブジェクトのテクスチャ、物理特性などのシミュレーション・パラメータの意図的な変動に頼っており、ロボットが条件間で一般化する表現を開発するよう強制します。このアプローチは移動に部分的な成功を遂行してきましたが、微細な運動制御と正確な接触力管理を必要とする器用な操作タスクではあまり効果的ではありませんでした。

MolmoBotのアプローチ

MolmoBotはAi2のMolmoビジョン言語モデルを基に構築されており、システムに視覚シーンと言語指示の豊かな理解を提供します。主な革新は、操作訓練のためにシミュレーションデータがどのように生成およびキュレートされるかです。単一のシミュレーション環境を使用する代わりに、チームは汎用可能なスキルを訓練するために十分な物理的忠実度で多様な操作シナリオを生成するためのパイプラインを開発しました。

このシステムは、接触動力学の向上されたシミュレーション忠実度と、シミュレートされた環境と実環境の間の視覚的違いに対する不変性を明示的に構築する表現学習アプローチを組み合わせています。ロボットは、タスク関連の視覚機能 — グリッパーの位置、操作されているオブジェクト、ターゲットの位置 — を識別することを学び、シミュレーション固有の視覚的な人工物をエンコードする表現を学ぶのではなく、シミュレーションと現実の間で同じに見えます。

民主化の議論

シミュレーションベースの訓練の経済的議論は簡単です。シミュレーションデータの生成には計算インフラストラクチャが必要ですが、物理的なロボット、訓練された人間のオペレータ、大規模なデモンストレーションデータセットの集約に必要な機関的な調整は必要ではありません。コンピューティングクラスターにアクセスできる小規模な大学の研究チームは、資金が豊富なラボが数万の物理的なデモンストレーションを収集するのに必要な時間で、数百万のシミュレートされた操作エピソードを生成できます。

シミュレーションで訓練されたモデルが、物理的に訓練されたシステムのパフォーマンスに匹敵するか、近づくことができる場合 — MolmoBotの結果が操作タスクの重大なクラスに対して達成可能であることを示唆しています — ロボット操作AI の機能ははるかに広い研究コミュニティにアクセス可能になります。

オープンリリース

Ai2の研究哲学と一貫して、MolmoBotシステムとそのシミュレーション訓練パイプラインはオープンにリリースされています。シミュレートされた操作軌跡のデータセット、訓練されたモデルの重み、およびシミュレーション環境ツールはすべて研究コミュニティで利用可能にされています — フィールドをリードしている商用ロボット工学AIプログラムの専有データおよびモデル戦略と直接対比するアプローチ。CEOのAli Farhadiは、目標を明示的に述べました。グローバル研究コミュニティが一緒に構築できるツールを通じて科学を進めるAIを構築すること。

この記事はAI Newsの報告に基づいています。元の記事を読む

Originally published on artificialintelligence-news.com