要約
大規模なオフライントレーニングの最近の進歩は、複雑なロボットタスクのジェネラリスト政策学習の可能性を実証しています。
ただし、これらの原則を脚のある移動に適用することは、継続的なダイナミクスと、多様な地形とロボットの形態にわたるリアルタイムの適応の必要性により、課題のままです。
この作業では、オフラインデータセットのみに依存して、複数の4倍のロボットと地形で単一のジェネラリストの移動ポリシーを学習するスケーラブルで注意ベースのフレームワークであるGroqlocoを提案します。
私たちのアプローチは、2つの異なる移動行動からの専門家のデモンストレーションを活用しています – 階段横断(非周期的歩行)とフラット地形トラバーサル(周期的な歩行) – 複数の四分流ロボットで収集され、両方の行動の行動融合を可能にする一般主義モデルを訓練します。
重要なことに、私たちのフレームワークは、ロボット固有のエンコーディングを組み込むことなく、すべてのロボットからの固有受容データで直接動作します。
このポリシーは、Intel I7 NUCに直接展開でき、テスト時間の最適化なしに低遅延制御出力を生成します。
当社の広範な実験は、市販の12kgのロボットであるUnitree Go1でのハードウェアの展開を含む、非常に多様な4倍のロボットと地形にわたる強力なゼロショット転送を示しています。
特に、ロボット全体に異なる移動スキルが不均一に分布する挑戦的なクロスロボットトレーニングセットアップを評価しますが、テスト時にすべてのロボットへのフラットウォーキングと階段横断挙動の両方の転送の成功を観察します。
また、微調整を必要とせずに、70kgの四足動画であるStoch 5で、平らな屋外の地形での予備的なウォーキングを示します。
これらの結果は、多様なロボットや地形にわたる堅牢なジェネラリストの移動の可能性を強調しています。
要約(オリジナル)
Recent advancements in large-scale offline training have demonstrated the potential of generalist policy learning for complex robotic tasks. However, applying these principles to legged locomotion remains a challenge due to continuous dynamics and the need for real-time adaptation across diverse terrains and robot morphologies. In this work, we propose GROQLoco, a scalable, attention-based framework that learns a single generalist locomotion policy across multiple quadruped robots and terrains, relying solely on offline datasets. Our approach leverages expert demonstrations from two distinct locomotion behaviors – stair traversal (non-periodic gaits) and flat terrain traversal (periodic gaits) – collected across multiple quadruped robots, to train a generalist model that enables behavior fusion for both behaviors. Crucially, our framework operates directly on proprioceptive data from all robots without incorporating any robot-specific encodings. The policy is directly deployable on an Intel i7 nuc, producing low-latency control outputs without any test-time optimization. Our extensive experiments demonstrate strong zero-shot transfer across highly diverse quadruped robots and terrains, including hardware deployment on the Unitree Go1, a commercially available 12kg robot. Notably, we evaluate challenging cross-robot training setups where different locomotion skills are unevenly distributed across robots, yet observe successful transfer of both flat walking and stair traversal behaviors to all robots at test time. We also show preliminary walking on Stoch 5, a 70kg quadruped, on flat and outdoor terrains without requiring any fine tuning. These results highlight the potential for robust generalist locomotion across diverse robots and terrains.
arxiv情報
著者 | Narayanan PP,Sarvesh Prasanth Venkatesan,Srinivas Kantha Reddy,Shishir Kolathaya |
発行日 | 2025-05-16 08:17:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google