Teacher Motion Priors: Enhancing Robot Locomotion over Challenging Terrain

要約

複雑な地形での堅牢な運動を達成することは、高次元の制御と環境不確実性のために依然として課題です。
このペーパーでは、教師の学生のパラダイムに基づいた教師の事前の枠組みを紹介し、学習効率と一般化を改善するために模倣と補助タスク学習を統合します。
エンコーダーベースの状態埋め込みに強く依存している従来のパラダイムとは異なり、フレームワークはネットワーク設計を切り離し、ポリシーネットワークと展開を簡素化します。
高性能の教師ポリシーは、特権情報を使用して一般化可能なモーションスキルを獲得するために最初にトレーニングされます。
教師の動き分布は、生成的な敵対的なメカニズムを介して、騒々しい固有受容データにのみ依存して、分布シフトによって引き起こされるパフォーマンスの劣化を緩和する学生ポリシーに転送されます。
さらに、補助タスク学習により、学生ポリシーの機能表現が強化され、収束が高速化され、さまざまな地形への適応性が向上します。
このフレームワークはヒューマノイドロボットで検証されており、動的な地形の移動安定性の大幅な改善と開発コストの大幅な削減を示しています。
この作業は、ヒューマノイドロボットに堅牢な移動戦略を展開するための実用的なソリューションを提供します。

要約(オリジナル)

Achieving robust locomotion on complex terrains remains a challenge due to high dimensional control and environmental uncertainties. This paper introduces a teacher prior framework based on the teacher student paradigm, integrating imitation and auxiliary task learning to improve learning efficiency and generalization. Unlike traditional paradigms that strongly rely on encoder-based state embeddings, our framework decouples the network design, simplifying the policy network and deployment. A high performance teacher policy is first trained using privileged information to acquire generalizable motion skills. The teacher’s motion distribution is transferred to the student policy, which relies only on noisy proprioceptive data, via a generative adversarial mechanism to mitigate performance degradation caused by distributional shifts. Additionally, auxiliary task learning enhances the student policy’s feature representation, speeding up convergence and improving adaptability to varying terrains. The framework is validated on a humanoid robot, showing a great improvement in locomotion stability on dynamic terrains and significant reductions in development costs. This work provides a practical solution for deploying robust locomotion strategies in humanoid robots.

arxiv情報

著者 Fangcheng Jin,Yuqi Wang,Peixin Ma,Guodong Yang,Pan Zhao,En Li,Zhengtao Zhang
発行日 2025-04-14 16:36:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T40, cs.AI, cs.RO パーマリンク