Continuous Control of Diverse Skills in Quadruped Robots Without Complete Expert Datasets

要約

四足動物の多様なスキルを学ぶことは、さまざまなスキルの間の複雑な移行を習得したり、さまざまな難しさのタスクを処理するなど、重要な課題をもたらします。
既存の模倣学習方法は、成功しますが、専門家の行動を再現するために高価なデータセットに依存しています。
内省的な学習に触発され、私たちは、完全な専門家データセットの必要性を排除する新しい方法である、進歩的な敵対的な自己想像スキル移行(PASIST)を提案します。
Pasistは、デモンストレーションの代わりに事前に定義されたターゲットポーズに基づいて高品質の軌跡を自律的に調査および選択し、生成的敵対的自己想像学習(GASIL)フレームワークを活用します。
学習をさらに強化するために、スキルの重みとさまざまなレベルの難易度のバランスをとることにより、モード崩壊を緩和するスキル選択モジュールを開発します。
これらの方法により、Pasistはターゲットポーズに対応するスキルを再現し、それらの間のスムーズで自然な移行を達成します。
シミュレーションプラットフォームとSOLO 8ロボットの両方での評価は、Pasistの有効性を確認し、専門家主導の学習に代わる効率的な代替品を提供します。

要約(オリジナル)

Learning diverse skills for quadruped robots presents significant challenges, such as mastering complex transitions between different skills and handling tasks of varying difficulty. Existing imitation learning methods, while successful, rely on expensive datasets to reproduce expert behaviors. Inspired by introspective learning, we propose Progressive Adversarial Self-Imitation Skill Transition (PASIST), a novel method that eliminates the need for complete expert datasets. PASIST autonomously explores and selects high-quality trajectories based on predefined target poses instead of demonstrations, leveraging the Generative Adversarial Self-Imitation Learning (GASIL) framework. To further enhance learning, We develop a skill selection module to mitigate mode collapse by balancing the weights of skills with varying levels of difficulty. Through these methods, PASIST is able to reproduce skills corresponding to the target pose while achieving smooth and natural transitions between them. Evaluations on both simulation platforms and the Solo 8 robot confirm the effectiveness of PASIST, offering an efficient alternative to expert-driven learning.

arxiv情報

著者 Jiaxin Tu,Xiaoyi Wei,Yueqi Zhang,Taixian Hou,Xiaofei Gao,Zhiyan Dong,Peng Zhai,Lihua Zhang
発行日 2025-03-05 13:12:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク