要約
最近、四足歩行は大きな成功を収めていますが、その操作能力、特に大きな物体を扱う能力は依然として限られており、捜索救助、建設、産業オートメーション、部屋の整理などの要求の厳しい現実世界の用途での有用性は制限されています。
この論文は、複数の四足ロボットによる障害物を認識した長距離推進のタスクに取り組みます。
我々は、3 つの制御レベルを持つ階層型マルチエージェント強化学習フレームワークを提案します。
上位レベルのコントローラーは、RRT プランナーと集中型の適応ポリシーを統合してサブ目標を生成します。一方、中間レベルのコントローラーは、分散型の目標条件付きポリシーを使用してロボットをこれらのサブ目標に向けて導きます。
事前トレーニングされた低レベルの移動ポリシーが移動コマンドを実行します。
シミュレーションでいくつかのベースラインに対してメソッドを評価したところ、最良のベースラインと比べて成功率が 36.0% 高く、完了時間が 24.5% 短縮され、ベースラインのアプローチに比べて大幅な改善が見られました。
私たちのフレームワークは、現実世界の Go1 ロボット上で、Push-Cuboid や Push-T などの長期にわたる障害物認識操作タスクを有効にします。
要約(オリジナル)
Recently, quadrupedal locomotion has achieved significant success, but their manipulation capabilities, particularly in handling large objects, remain limited, restricting their usefulness in demanding real-world applications such as search and rescue, construction, industrial automation, and room organization. This paper tackles the task of obstacle-aware, long-horizon pushing by multiple quadrupedal robots. We propose a hierarchical multi-agent reinforcement learning framework with three levels of control. The high-level controller integrates an RRT planner and a centralized adaptive policy to generate subgoals, while the mid-level controller uses a decentralized goal-conditioned policy to guide the robots toward these sub-goals. A pre-trained low-level locomotion policy executes the movement commands. We evaluate our method against several baselines in simulation, demonstrating significant improvements over baseline approaches, with 36.0% higher success rates and 24.5% reduction in completion time than the best baseline. Our framework successfully enables long-horizon, obstacle-aware manipulation tasks like Push-Cuboid and Push-T on Go1 robots in the real world.
arxiv情報
著者 | Chuye Hong,Yuming Feng,Yaru Niu,Shiqi Liu,Yuxiang Yang,Wenhao Yu,Tingnan Zhang,Jie Tan,Ding Zhao |
発行日 | 2024-11-11 16:27:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google