Learning Arm-Assisted Fall Damage Reduction and Recovery for Legged Mobile Manipulators

要約

適応型落下および回復スキルにより、ロボット展開の適用性が大幅に拡張されます。
脚付きのモバイル マニピュレーターの場合、ロボット アームは適応的に落下を止め、回復を支援することができます。
脚付きモバイル マニピュレータの落下および回復戦略に関する以前の研究は、通常、リアルタイム計算を可能にするために、非弾性衝突や定義された方向への落下などの仮定に依存しています。
この論文では、落下による損傷と回復を軽減するための学習ベースのアプローチを紹介します。
非対称のアクター批評家トレーニング構造を使用して、時変報酬関数を使用して時不変ポリシーをトレーニングします。
シミュレートされた実験では、ポリシーは最初の落下構成の 98.9\% から回復します。
ベースラインの方法と比較して、落下中のベース コンタクト インパルス、ピーク ジョイント内力、およびベースの加速が減少します。
トレーニング済みの制御ポリシーは、ALMA ロボット ハードウェアに展開され、広範囲にテストされています。
提案された方法とハードウェア テストをまとめたビデオは、https://youtu.be/avwg2HqGi8s で入手できます。

要約(オリジナル)

Adaptive falling and recovery skills greatly extend the applicability of robot deployments. In the case of legged mobile manipulators, the robot arm could adaptively stop the fall and assist the recovery. Prior works on falling and recovery strategies for legged mobile manipulators usually rely on assumptions such as inelastic collisions and falling in defined directions to enable real-time computation. This paper presents a learning-based approach to reducing fall damage and recovery. An asymmetric actor-critic training structure is used to train a time-invariant policy with time-varying reward functions. In simulated experiments, the policy recovers from 98.9\% of initial falling configurations. It reduces base contact impulse, peak joint internal forces, and base acceleration during the fall compared to the baseline methods. The trained control policy is deployed and extensively tested on the ALMA robot hardware. A video summarizing the proposed method and the hardware tests is available at https://youtu.be/avwg2HqGi8s.

arxiv情報

著者 Yuntao Ma,Farbod Farshidian,Marco Hutter
発行日 2023-03-09 18:39:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク