AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control

要約

四葉型ロボットは多目的な移動スキルを学ぶことができますが、1つ以上のジョイントが電力を失った場合、脆弱なままです。
対照的に、犬と猫は、負傷時に足を引きずる歩行を採用することができ、身体的状態に適応する驚くべき能力を示しています。
このような適応性に触発されたこのペーパーでは、四足動物が複数の関節断層の下で安定した歩行のために歩行を自律的に適応させることを可能にする、新しい教師と学生の強化学習フレームワークであるアクション学習者(ACL)を紹介します。
厳格な模倣を強制する従来の教師と学生のアプローチとは異なり、ACLは教師ポリシーを活用してスタイルの報酬を生成し、正確な複製を必要とせずに生徒のポリシーを導きます。
それぞれが異なる障害状態に対応する複数の教師ポリシーをトレーニングし、その後、それらをエンコーダーデコダーアーキテクチャを使用して単一の学生ポリシーに蒸留します。
以前の作業は主に単一の障害に対処していますが、ACLは、断層が発生したときに異なるリッピング歩行を自律的に切り替える、1つまたは2つの脚に沿って最大4つの故障したジョイントを使用して四足動物を歩くことができます。
単一関節および二重ジョイント断層の下で、実際のGO2四分足節のロボットでACLを検証し、断層耐性の安定した歩行、通常の歩行と子羊の歩行の間の滑らかな歩行遷移、および外乱に対する堅牢性を示します。

要約(オリジナル)

Quadrupedal robots can learn versatile locomotion skills but remain vulnerable when one or more joints lose power. In contrast, dogs and cats can adopt limping gaits when injured, demonstrating their remarkable ability to adapt to physical conditions. Inspired by such adaptability, this paper presents Action Learner (AcL), a novel teacher-student reinforcement learning framework that enables quadrupeds to autonomously adapt their gait for stable walking under multiple joint faults. Unlike conventional teacher-student approaches that enforce strict imitation, AcL leverages teacher policies to generate style rewards, guiding the student policy without requiring precise replication. We train multiple teacher policies, each corresponding to a different fault condition, and subsequently distill them into a single student policy with an encoder-decoder architecture. While prior works primarily address single-joint faults, AcL enables quadrupeds to walk with up to four faulty joints across one or two legs, autonomously switching between different limping gaits when faults occur. We validate AcL on a real Go2 quadruped robot under single- and double-joint faults, demonstrating fault-tolerant, stable walking, smooth gait transitions between normal and lamb gaits, and robustness against external disturbances.

arxiv情報

著者 Tianyu Xu,Yaoyu Cheng,Pinxi Shen,Lin Zhao,Electrical,Computer Engineering,National University of Singapore,Singapore,Mechanical Engineering,National University of Singapore,Singapore
発行日 2025-03-27 11:47:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク