要約
人間の動作スキルを人型ロボットに移すことは依然として大きな課題です。
この研究では、Wasserstein の敵対的模倣学習システムを導入します。これにより、人型ロボットが自然な全身移動パターンを複製し、人間の動きを模倣することでシームレスな遷移を実行できるようになります。
まず、任意の人間のデモンストレーターと人型ロボットの間の形態学的差異を軽減するための、統合されたプリミティブ スケルトン モーションのリターゲティングを提案します。
敵対的批判コンポーネントは強化学習 (RL) と統合されており、混合参照モーションのデータ分布に合わせた動作を生成するように制御ポリシーをガイドします。
さらに、トレーニング プロセスを安定させ、モデルの崩壊を防ぐために、特定の積分確率メトリック (IPM)、つまり新しいソフト境界制約を備えた Wasserstein-1 距離を採用します。
私たちのシステムは、シミュレータで実物大の人型 JAXON 上で評価されます。
結果として得られる制御ポリシーは、立位、押し込み回復、しゃがみ歩行、人間のような直足歩行、ダイナミックなランニングなど、幅広い移動パターンを示します。
特に、デモンストレーション データセットに移行動作が存在しない場合でも、ロボットは、望ましい速度の変化に応じて異なる移動パターン間を自然に移行する新たな能力を示しています。
要約(オリジナル)
Transferring human motion skills to humanoid robots remains a significant challenge. In this study, we introduce a Wasserstein adversarial imitation learning system, allowing humanoid robots to replicate natural whole-body locomotion patterns and execute seamless transitions by mimicking human motions. First, we present a unified primitive-skeleton motion retargeting to mitigate morphological differences between arbitrary human demonstrators and humanoid robots. An adversarial critic component is integrated with Reinforcement Learning (RL) to guide the control policy to produce behaviors aligned with the data distribution of mixed reference motions. Additionally, we employ a specific Integral Probabilistic Metric (IPM), namely the Wasserstein-1 distance with a novel soft boundary constraint to stabilize the training process and prevent model collapse. Our system is evaluated on a full-sized humanoid JAXON in the simulator. The resulting control policy demonstrates a wide range of locomotion patterns, including standing, push-recovery, squat walking, human-like straight-leg walking, and dynamic running. Notably, even in the absence of transition motions in the demonstration dataset, robots showcase an emerging ability to transit naturally between distinct locomotion patterns as desired speed changes.
arxiv情報
著者 | Annan Tang,Takuma Hiraoka,Naoki Hiraoka,Fan Shi,Kento Kawaharazuka,Kunio Kojima,Kei Okada,Masayuki Inaba |
発行日 | 2024-03-05 07:07:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google