Saving the Limping: Fault-tolerant Quadruped Locomotion via Reinforcement Learning

要約

現代の四足動物は、遠隔の制御されていない環境で平坦でない地形を横断したり、さらには全力疾走したりするのが得意です。
ただし、野生環境で生き残るためには、機動性だけでなく、潜在的な重大なハードウェア障害に対処する能力も必要です。
四足動物にそのような能力を与える方法はほとんど研究されていません。
この論文では、シミュレーションと物理世界の両方で、四足歩行用のハードウェア フォールトトレラント コントローラーをトレーニングおよびテストするための新しい方法論を提案します。
教師と生徒の強化学習フレームワークを採用して、シミュレーションで現実に近い関節ロックの失敗を伴うコントローラーをトレーニングします。これは、微調整することなく物理ロボットにゼロショットで転送できます。
広範な実験により、当社のフォールトトレラント コントローラーは、四足動物が移動中に関節の故障に直面した場合でも効率的に安定して誘導できることが示されています。

要約(オリジナル)

Modern quadrupeds are skillful in traversing or even sprinting on uneven terrains in a remote uncontrolled environment. However, survival in the wild requires not only maneuverability, but also the ability to handle potential critical hardware failures. How to grant such ability to quadrupeds is rarely investigated. In this paper, we propose a novel methodology to train and test hardware fault-tolerant controllers for quadruped locomotion, both in the simulation and physical world. We adopt the teacher-student reinforcement learning framework to train the controller with close-to-reality joint-locking failure in the simulation, which can be zero-shot transferred to the physical robot without any fine-tuning. Extensive experiments show that our fault-tolerant controller can efficiently lead a quadruped stably when it faces joint failures during locomotion.

arxiv情報

著者 Dikai Liu,Tianwei Zhang,Jianxiong Yin,Simon See
発行日 2023-09-07 06:26:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク