Saving the Limping: Fault-tolerant Quadruped Locomotion via Reinforcement Learning

要約

現代の四足動物は、人里離れた制御されていない環境で、でこぼこした地形を横断したり、全力疾走したりすることに長けています。
ただし、野生で生き残るには、機動性だけでなく、潜在的な重大なハードウェア障害に対処する能力も必要です。
四足動物にそのような能力を付与する方法はめったに調査されません。
このホワイトペーパーでは、シミュレーションと物理世界の両方で、四足歩行用のハードウェアフォールトトレラントコントローラーをトレーニングおよびテストするための新しい方法論を提案します。
教師と生徒の強化学習フレームワークを採用して、シミュレーションで現実に近いジョイントロックの失敗でコントローラーをトレーニングします。これは、微調整なしで物理ロボットにゼロショット転送できます。
広範な実験により、移動中に関節障害に直面したときに、フォールトトレラントコントローラーが四足歩行を効率的に安定して導くことができることが示されています。

要約(オリジナル)

Modern quadrupeds are skillful in traversing or even sprinting on uneven terrains in a remote uncontrolled environment. However, survival in the wild requires not only maneuverability, but also the ability to handle potential critical hardware failures. How to grant such ability to quadrupeds is rarely investigated. In this paper, we propose a novel methodology to train and test hardware fault-tolerant controllers for quadruped locomotion, both in the simulation and physical world. We adopt the teacher-student reinforcement learning framework to train the controller with close-to-reality joint-locking failure in the simulation, which can be zero-shot transferred to the physical robot without any fine-tuning. Extensive experiments show that our fault-tolerant controller can efficiently lead a quadruped stably when it faces joint failure during locomotion.

arxiv情報

著者 Dikai Liu,Tianwei Zhang,Jianxiong Yin,Simon See
発行日 2023-03-08 09:27:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク