Deep Whole-Body Control: Learning a Unified Policy for Manipulation and Locomotion

要約

取り付けられたアームは、脚付きロボットのいくつかのモバイル操作タスクへの適用性を大幅に向上させることができます。
このような脚のあるマニピュレーターの標準的な階層制御パイプラインは、コントローラーを操作と移動のコントローラーに分離することです。
ただし、これは効果がありません。
腕と脚の間の調整をサポートするには膨大なエンジニアリングが必要であり、エラーがモジュール全体に伝播して、滑らかでない不自然な動きを引き起こす可能性があります。
また、手足全体の強力な運動相乗効果の証拠を考えると、生物学的に信じがたいことです。
この作業では、強化学習を使用して脚マニピュレータの全身制御のための統一されたポリシーを学習することを提案します。
高自由度制御のための Sim2Real ギャップを埋める正規化されたオンライン適応と、全身システムのトレーニング中に極小値を克服するためにアクション空間の因果関係を利用するアドバンテージ ミキシングを提案します。
また、低コストの脚付きマニピュレーターのシンプルな設計を提示し、統一されたポリシーがいくつかのタスク設定にわたって動的で機敏な動作を示すことができることを発見しました。
ビデオは https://maniploco.github.io にあります

要約(オリジナル)

An attached arm can significantly increase the applicability of legged robots to several mobile manipulation tasks that are not possible for the wheeled or tracked counterparts. The standard hierarchical control pipeline for such legged manipulators is to decouple the controller into that of manipulation and locomotion. However, this is ineffective. It requires immense engineering to support coordination between the arm and legs, and error can propagate across modules causing non-smooth unnatural motions. It is also biological implausible given evidence for strong motor synergies across limbs. In this work, we propose to learn a unified policy for whole-body control of a legged manipulator using reinforcement learning. We propose Regularized Online Adaptation to bridge the Sim2Real gap for high-DoF control, and Advantage Mixing exploiting the causal dependency in the action space to overcome local minima during training the whole-body system. We also present a simple design for a low-cost legged manipulator, and find that our unified policy can demonstrate dynamic and agile behaviors across several task setups. Videos are at https://maniploco.github.io

arxiv情報

著者 Zipeng Fu,Xuxin Cheng,Deepak Pathak
発行日 2022-10-18 17:59:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク