SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning


このシステムは、1) 指示に従う視覚モバイル操作のための高レベルのポリシーの階層設計と、四足歩行と四肢制御のための低レベルのポリシー、2) 長期的なタスクを解決するための漸進的なポリシー拡張アプローチで構成されます。
これには、高レベルの視覚運動ポリシーの効率的な高レベルトレーニングのための教師と生徒のフレームワーク、および 3) シミュレーションと実際のギャップを最小限に抑えるための一連のテクニックが含まれます。
予算に優しいものの、信頼性とパフォーマンスが限られているハードウェアと、手首に取り付けられた RGB カメラ 1 台だけを備えたシステム全体は、シミュレーションで完全に訓練されており、流動的なシミュレーションを使用して、検索、移動、把握、ドロップインを含む長期にわたるタスクで高い成功率を達成します。


We present a low-cost quadruped manipulation system that solves long-horizon real-world tasks, trained by reinforcement learning purely in simulation. The system comprises 1) a hierarchical design of a high-level policy for visual-mobile manipulation following instructions, and a low-level policy for quadruped movement and limb-control, 2) a progressive policy expansion approach for solving the long-horizon task together with a teacher-student framework for efficient high-level training of the high-level visuomotor policy, and 3) a suite of techniques for minimizing sim-to-real gaps. With budget-friendly but limited reliability and performance hardware, and just one wrist-mounted RGB camera, the entire system fully trained in simulation achieves high success rates for long horizon tasks involving search, move, grasp, and drop-into, with fluid sim-to-real transfer in a wide variety of indoor and outdoor scenes and lighting conditions.Extensive real-world evaluations show that on the long horizon mobile manipulation tasks, our system achieves good performance when transferred to real both in terms of task success rate and execution efficiency. Finally, we discuss the necessity of our sim-to-real techniques for legged mobile manipulation, and show their ablation performance.


著者 Haichao Zhang,Haonan Yu,Le Zhao,Andrew Choi,Qinxun Bai,Yiqing Yang,Wei Xu
発行日 2025-01-17 01:32:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク