Terrain-Aware Quadrupedal Locomotion via Reinforcement Learning

要約

自然界では、脚のある動物は知覚を通じて困難な地形に適応する能力を発達させており、事前に体と足の安全な軌道を計画できるため、安全でエネルギー効率の高い移動が可能になります。
この観察に触発されて、我々は、四足ロボットが起伏の多い地形を移動するためのパラメータ化された軌道ジェネレータと固有受容状態と外受容状態を統合するディープ ニューラル ネットワーク (DNN) ポリシーをトレーニングするための新しいアプローチを紹介します。
私たちの重要なアイデアは、足の高さや周波数などの軌道ジェネレーターのパラメーターを変更して、さまざまな地形に適応できる DNN ポリシーを使用することです。
ロボットが安全な領域を踏んでエネルギー消費を節約できるようにするために、足の地形報酬と持ち上げ足の高さの報酬をそれぞれ提案します。
これらの報酬を組み込むことで、私たちの方法は、四足ロボットをあらゆる方向に柔軟に移動できる、より安全で効率的な地形認識移動ポリシーを学習できます。
アプローチの有効性を評価するために、階段、飛び石、ポールなどの困難な地形でシミュレーション実験を実施します。
シミュレーション結果は、私たちのアプローチがロボットにそのような厳しい地形を任意の方向に横断するようにうまく指示できることを示しています。
さらに、ギャップが 25.5 cm 以上の飛び石を通過することを学習する実際の脚式ロボットでこの手法を検証します。

要約(オリジナル)

In nature, legged animals have developed the ability to adapt to challenging terrains through perception, allowing them to plan safe body and foot trajectories in advance, which leads to safe and energy-efficient locomotion. Inspired by this observation, we present a novel approach to train a Deep Neural Network (DNN) policy that integrates proprioceptive and exteroceptive states with a parameterized trajectory generator for quadruped robots to traverse rough terrains. Our key idea is to use a DNN policy that can modify the parameters of the trajectory generator, such as foot height and frequency, to adapt to different terrains. To encourage the robot to step on safe regions and save energy consumption, we propose foot terrain reward and lifting foot height reward, respectively. By incorporating these rewards, our method can learn a safer and more efficient terrain-aware locomotion policy that can move a quadruped robot flexibly in any direction. To evaluate the effectiveness of our approach, we conduct simulation experiments on challenging terrains, including stairs, stepping stones, and poles. The simulation results demonstrate that our approach can successfully direct the robot to traverse such tough terrains in any direction. Furthermore, we validate our method on a real legged robot, which learns to traverse stepping stones with gaps over 25.5cm.

arxiv情報

著者 Haojie Shi,Qingxu Zhu,Lei Han,Wanchao Chi,Tingguang Li,Max Q. -H. Meng
発行日 2023-10-11 03:31:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク