SafeSteps: Learning Safer Footstep Planning Policies for Legged Robots via Model-Based Priors

要約

私たちは、その決定においてAprioriの安全情報を直接考慮することができる四長子運動のための足跡計画方針を提示します。
そのコアでは、学習プロセスが地形パッチを分析し、各着陸場所を運動学的な実現可能性、すねの衝突、地形の粗さで分類します。
この情報は、小さなベクトル表現にエンコードされ、足跡計画ポリシーに追加の状態として渡されます。さらに、近位ポリシー最適化アルゴリズムのマスクされたバリアントを適用することにより、安全な足音の場所のみを提案します。
提案されたアプローチのパフォーマンスは、さまざまなラフな地形シナリオで歩いている電気4倍のロボットでの比較シミュレーションと実験によって示されます。
上記の安全条件の違反は、トレーニング中とポリシーの連続的な展開の両方で大幅に減少し、本質的に安全な足音プランナーになることを示しています。
さらに、副産物として、ポリシーの動作を形作るために必要な報酬条件が少ない方法を示します。

要約(オリジナル)

We present a footstep planning policy for quadrupedal locomotion that is able to directly take into consideration a-priori safety information in its decisions. At its core, a learning process analyzes terrain patches, classifying each landing location by its kinematic feasibility, shin collision, and terrain roughness. This information is then encoded into a small vector representation and passed as an additional state to the footstep planning policy, which furthermore proposes only safe footstep location by applying a masked variant of the Proximal Policy Optimization algorithm. The performance of the proposed approach is shown by comparative simulations and experiments on an electric quadruped robot walking in different rough terrain scenarios. We show that violations of the above safety conditions are greatly reduced both during training and the successive deployment of the policy, resulting in an inherently safer footstep planner. Furthermore, we show how, as a byproduct, fewer reward terms are needed to shape the behavior of the policy, which in return is able to achieve both better final performances and sample efficiency.

arxiv情報

著者 Shafeef Omar,Lorenzo Amatucci,Victor Barasuol,Giulio Turrisi,Claudio Semini
発行日 2025-01-29 14:42:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク