要約
多様なタスク、環境、および物理的実施形態で動作できるジェネラリストエージェントの開発は、ロボット工学と人工知能における壮大な課題です。
この作業では、実施形態の軸に焦点を当て、実施形態のスケーリング法$ \ unicode {x2013} $の訓練具体化の数を増やすことで、目に見えないものへの一般化が改善されるという仮説を調査します。
ロボットの移動をテストベッドとして使用して、ヒューマノイド、四足動物、六角形に及ぶ$ \ sim $ 1,000のさまざまな実施形態のデータセットを手続き的に生成し、ランダムなサブセットで多様な観察スペースと作用スペースを処理できるジェネラリストのポリシーを訓練します。
トレーニングの具体化の数を増やすと、目に見えないものへの一般化が改善され、スケーリングの実施形態が、小さく固定された実施形態に関するデータのスケーリングよりも具体化レベルの一般化を可能にするのに効果的であることがわかります。
特に、完全なデータセットで訓練された私たちの最良のポリシーは、Unitree GO2やH1などの現実世界の新しい実施形態へのゼロショット転送です。
これらの結果は、構成可能なロボットの適応制御、形態と制御の共同設計、およびそれ以降の一般的な具体化された知性に向けたステップを表しています。
要約(オリジナル)
Developing generalist agents that can operate across diverse tasks, environments, and physical embodiments is a grand challenge in robotics and artificial intelligence. In this work, we focus on the axis of embodiment and investigate embodiment scaling laws$\unicode{x2013}$the hypothesis that increasing the number of training embodiments improves generalization to unseen ones. Using robot locomotion as a test bed, we procedurally generate a dataset of $\sim$1,000 varied embodiments, spanning humanoids, quadrupeds, and hexapods, and train generalist policies capable of handling diverse observation and action spaces on random subsets. We find that increasing the number of training embodiments improves generalization to unseen ones, and scaling embodiments is more effective in enabling embodiment-level generalization than scaling data on small, fixed sets of embodiments. Notably, our best policy, trained on the full dataset, zero-shot transfers to novel embodiments in the real world, such as Unitree Go2 and H1. These results represent a step toward general embodied intelligence, with potential relevance to adaptive control for configurable robots, co-design of morphology and control, and beyond.
arxiv情報
著者 | Bo Ai,Liu Dai,Nico Bohlinger,Dichen Li,Tongzhou Mu,Zhanxin Wu,K. Fay,Henrik I. Christensen,Jan Peters,Hao Su |
発行日 | 2025-05-09 03:25:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google