Learning Torque Control for Quadrupedal Locomotion


強化学習 (RL) は、四足歩行ロボットのコントローラーを開発するための有望なアプローチになっています。
従来、移動のための RL 設計は位置ベースのパラダイムに従います。このパラダイムでは、RL ポリシーが低周波数で目標関節位置を出力し、高周波数の比例微分 (PD) コントローラーによって追跡され、関節トルクを生成します。
モデルベース制御の最近の進歩に照らして、トルクベースの RL フレームワークを導入することにより、位置ベースの RL パラダイムの代替手段を探ります。
私たちの知る限り、これは四足歩行のエンドツーエンドの学習トルク制御のための最初の sim-to-real の試みです。


Reinforcement learning (RL) has become a promising approach to developing controllers for quadrupedal robots. Conventionally, an RL design for locomotion follows a position-based paradigm, wherein an RL policy outputs target joint positions at a low frequency that are then tracked by a high-frequency proportional-derivative (PD) controller to produce joint torques. In contrast, for the model-based control of quadrupedal locomotion, there has been a paradigm shift from position-based control to torque-based control. In light of the recent advances in model-based control, we explore an alternative to the position-based RL paradigm, by introducing a torque-based RL framework, where an RL policy directly predicts joint torques at a high frequency, thus circumventing the use of a PD controller. The proposed learning torque control framework is validated with extensive experiments, in which a quadruped is capable of traversing various terrain and resisting external disturbances while following user-specified commands. Furthermore, compared to learning position control, learning torque control demonstrates the potential to achieve a higher reward and is more robust to significant external disturbances. To our knowledge, this is the first sim-to-real attempt for end-to-end learning torque control of quadrupedal locomotion.


著者 Shuxiao Chen,Bike Zhang,Mark W. Mueller,Akshara Rai,Koushil Sreenath
発行日 2023-03-13 03:15:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク