Learning Visual Quadrupedal Loco-Manipulation from Demonstrations

要約

四足歩行ロボットは、人間の環境に徐々に組み込まれつつある。四足歩行ロボットの運動能力は向上しているものの、現実的なシーンにおける物体とのインタラクションはまだ限定的である。四足歩行ロボットにロボットアームを追加することで、物体を操作することは可能であるが、四足歩行ロボットは基本的に4本の手足を備えた移動ユニットであり、それぞれが3自由度(DoF)を有していることから、冗長である場合がある。そこで我々は、四足歩行ロボットが脚のみで実世界の操作タスクを実行できるようにすることを目指す。我々は、ロコマニピュレーションのプロセスを、低レベルの強化学習(RL)ベースのコントローラと、高レベルの行動クローニング(BC)ベースのプランナに分解する。操作軌道をパラメータ化することで、上層と下層の努力を同期させ、RLとBCの両方の利点を活用する。我々のアプローチは、シミュレーションと実世界の実験によって検証され、移動中に地面からバスケットを持ち上げる、食器洗浄機を閉める、ボタンを押す、ドアを押すなど、機動性と高精度が要求されるタスクをロボットが実行できることを実証している。プロジェクトウェブサイト:https://zhengmaohe.github.io/leg-manip

要約(オリジナル)

Quadruped robots are progressively being integrated into human environments. Despite the growing locomotion capabilities of quadrupedal robots, their interaction with objects in realistic scenes is still limited. While additional robotic arms on quadrupedal robots enable manipulating objects, they are sometimes redundant given that a quadruped robot is essentially a mobile unit equipped with four limbs, each possessing 3 degrees of freedom (DoFs). Hence, we aim to empower a quadruped robot to execute real-world manipulation tasks using only its legs. We decompose the loco-manipulation process into a low-level reinforcement learning (RL)-based controller and a high-level Behavior Cloning (BC)-based planner. By parameterizing the manipulation trajectory, we synchronize the efforts of the upper and lower layers, thereby leveraging the advantages of both RL and BC. Our approach is validated through simulations and real-world experiments, demonstrating the robot’s ability to perform tasks that demand mobility and high precision, such as lifting a basket from the ground while moving, closing a dishwasher, pressing a button, and pushing a door. Project website: https://zhengmaohe.github.io/leg-manip

arxiv情報

著者 Zhengmao He,Kun Lei,Yanjie Ze,Koushil Sreenath,Zhongyu Li,Huazhe Xu
発行日 2024-08-02 16:51:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク