要約
四足ロボットの従来の強化学習制御は特権情報に依存することが多く、細心の選択と正確な推定が要求されるため、開発プロセスに制約が課せられます。
この研究では、特権情報を必要とせずに高性能な制御ポリシー学習を実現する自己学習潜在表現 (SLR) 手法を提案します。
提案された手法の評価の信頼性を高めるために、SLR は、元の作成者の構成パラメーターを保持した状態で、最先端のアルゴリズムのオープンソース コード リポジトリと比較されます。
4 つのリポジトリにわたって、SLR は一貫して参照結果を上回っています。
最終的に、訓練されたポリシーとエンコーダーにより、四足ロボットは段差を移動したり、階段を登ったり、岩を登ったり、さまざまな困難な地形を横断したりできるようになります。
ロボット実験のビデオは https://11chens.github.io/SLR/ にあります。
要約(オリジナル)
Traditional reinforcement learning control for quadruped robots often relies on privileged information, demanding meticulous selection and precise estimation, thereby imposing constraints on the development process. This work proposes a Self-learning Latent Representation (SLR) method, which achieves high-performance control policy learning without the need for privileged information. To enhance the credibility of our proposed method’s evaluation, SLR is compared with open-source code repositories of state-of-the-art algorithms, retaining the original authors’ configuration parameters. Across four repositories, SLR consistently outperforms the reference results. Ultimately, the trained policy and encoder empower the quadruped robot to navigate steps, climb stairs, ascend rocks, and traverse various challenging terrains. Robot experiment videos are at https://11chens.github.io/SLR/
arxiv情報
著者 | Shiyi Chen,Zeyu Wan,Shiyang Yan,Chun Zhang,Weiyi Zhang,Qiang Li,Debing Zhang,Fasih Ud Din Farrukh |
発行日 | 2024-06-07 11:06:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google