要約
このペーパーでは、現実世界のヒューマノイドロボットが人間のような動きを実行しながら安定性を維持できるようにする新しいフレームワークを紹介します。
現在の方法は、補強学習を介して大規模なリターゲティングされた人間のデータを使用して、ヒューマノイドロボットが人体を追うことを可能にするポリシーを訓練します。
ただし、人間とヒューマノイドのロボットの動きの間の不均一性により、リターゲティングされた人間の動きを直接使用すると、トレーニングの効率と安定性が低下します。
この目的のために、人間とヒューマノイドの作用スペースのギャップを埋める新しい全身追跡フレームワークであるSMAPを紹介し、ヒューマノイドロボットによる正確な動きの模倣を可能にします。
核となるアイデアは、ベクトル定量化された周期自動エンコーダーを使用して、一般的な原子行動をキャプチャし、人間の動きを身体的にもっともらしいヒューマノイド運動に適応させることです。
この適応は、トレーニングの収束を加速し、新しい動きや挑戦的な動きを処理するときに安定性を向上させます。
その後、特権教師を採用して、提案された報酬を提案して、正確な模倣スキルを学生ポリシーに蒸留します。
シミュレーションと現実世界で実験を実施して、SOTAメソッドよりもSMAPの優位性の安定性とパフォーマンスを実証し、ヒューマノイドロボットで全身制御を進めるための実用的なガイドラインを提供します。
要約(オリジナル)
This paper presents a novel framework that enables real-world humanoid robots to maintain stability while performing human-like motion. Current methods train a policy which allows humanoid robots to follow human body using the massive retargeted human data via reinforcement learning. However, due to the heterogeneity between human and humanoid robot motion, directly using retargeted human motion reduces training efficiency and stability. To this end, we introduce SMAP, a novel whole-body tracking framework that bridges the gap between human and humanoid action spaces, enabling accurate motion mimicry by humanoid robots. The core idea is to use a vector-quantized periodic autoencoder to capture generic atomic behaviors and adapt human motion into physically plausible humanoid motion. This adaptation accelerates training convergence and improves stability when handling novel or challenging motions. We then employ a privileged teacher to distill precise mimicry skills into the student policy with a proposed decoupled reward. We conduct experiments in simulation and real world to demonstrate the superiority stability and performance of SMAP over SOTA methods, offering practical guidelines for advancing whole-body control in humanoid robots.
arxiv情報
著者 | Haoyu Zhao,Sixu Lin,Qingwei Ben,Minyue Dai,Hao Fei,Jingbo Wang,Hua Zou,Junting Dong |
発行日 | 2025-05-26 03:37:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google