HiLMa-Res: A General Hierarchical Framework via Residual RL for Combining Quadrupedal Locomotion and Manipulation

要約

この研究では、四足ロボットを使用して連続移動を実行しながら操作タスクに取り組むための強化学習を活用した階層型フレームワークである HiLMa-Res を紹介します。
特定のタスクの解決に焦点を当てたこれまでのほとんどの取り組みとは異なり、HiLMa-Res は、持続的な移動性を維持するために四足歩行ロボットを必要とするさまざまな移動操作タスクに汎用的に対応できるように設計されています。
このフレームワークの斬新な設計は、脚を使用した継続的な移動制御と操作を統合するという課題に取り組みます。
さまざまな速度で歩行しながら、任意のロボットのエンドエフェクター (つま先) の軌道を追跡できる操作空間移動コントローラーを開発します。
このコントローラーは、さまざまなダウンストリーム タスクに汎用となるように設計されているため、特定のタスクに対処するための高レベルの操作計画ポリシーで利用できます。
このフレームワークの多用途性を実証するために、HiLMa-Res を利用して、現実世界で四足歩行ロボットを使用したいくつかの困難な移動操作タスクに取り組みます。
これらのタスクは、状態ベースのポリシーの活用からビジョンベースのポリシーまで、純粋にシミュレーション データからのトレーニングから現実世界のデータからの学習まで多岐にわたります。
これらのタスクでは、HiLMa-Res は他の方法よりも優れたパフォーマンスを示します。

要約(オリジナル)

This work presents HiLMa-Res, a hierarchical framework leveraging reinforcement learning to tackle manipulation tasks while performing continuous locomotion using quadrupedal robots. Unlike most previous efforts that focus on solving a specific task, HiLMa-Res is designed to be general for various loco-manipulation tasks that require quadrupedal robots to maintain sustained mobility. The novel design of this framework tackles the challenges of integrating continuous locomotion control and manipulation using legs. It develops an operational space locomotion controller that can track arbitrary robot end-effector (toe) trajectories while walking at different velocities. This controller is designed to be general to different downstream tasks, and therefore, can be utilized in high-level manipulation planning policy to address specific tasks. To demonstrate the versatility of this framework, we utilize HiLMa-Res to tackle several challenging loco-manipulation tasks using a quadrupedal robot in the real world. These tasks span from leveraging state-based policy to vision-based policy, from training purely from the simulation data to learning from real-world data. In these tasks, HiLMa-Res shows better performance than other methods.

arxiv情報

著者 Xiaoyu Huang,Qiayuan Liao,Yiming Ni,Zhongyu Li,Laura Smith,Sergey Levine,Xue Bin Peng,Koushil Sreenath
発行日 2024-07-09 06:31:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク