Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration

要約

ヒューマノイド ロボットは、特に激しい反復労働を必要とするシナリオにおいて、人間レベルの幅広い移動操作タスクを実行できる、具体化されたインテリジェント エージェントとして構想されています。
しかし、ヒューマノイドロボットは自由度が高いため、これらのスキルの習得は困難であり、ヒューマノイド用の十分なトレーニングデータを収集するのは骨の折れるプロセスです。
新しいヒューマノイド プラットフォームの急速な導入を考慮すると、一般化可能なスキルの伝達を可能にするクロスボディのフレームワークがますます重要になっています。
これに対処するために、統一されたデジタル ヒューマン モデルを共通のプロトタイプとして使用し、新しいロボット プラットフォームごとに再トレーニングする必要を回避することで、データのボトルネックを軽減する移行可能なフレームワークを提案します。
モデルは、敵対的な模倣を通じて人間のデモンストレーションから動作プリミティブを学習し、複雑なロボット構造は機能コンポーネントに分解され、それぞれが独立してトレーニングされ、動的に調整されます。
タスクの一般化は人間とオブジェクトのインタラクショングラフを通じて実現され、スキルは実施形態固有の運動学的な動きの再目標設定と動的微調整を通じてさまざまなロボットに伝達されます。
私たちのフレームワークは、さまざまな構成を持つ 5 台の人型ロボットで検証され、安定した移動操作が実証され、データ要件の削減とプラットフォーム間でのスキル伝達の効率向上におけるその有効性が強調されています。

要約(オリジナル)

Humanoid robots are envisioned as embodied intelligent agents capable of performing a wide range of human-level loco-manipulation tasks, particularly in scenarios requiring strenuous and repetitive labor. However, learning these skills is challenging due to the high degrees of freedom of humanoid robots, and collecting sufficient training data for humanoid is a laborious process. Given the rapid introduction of new humanoid platforms, a cross-embodiment framework that allows generalizable skill transfer is becoming increasingly critical. To address this, we propose a transferable framework that reduces the data bottleneck by using a unified digital human model as a common prototype and bypassing the need for re-training on every new robot platform. The model learns behavior primitives from human demonstrations through adversarial imitation, and the complex robot structures are decomposed into functional components, each trained independently and dynamically coordinated. Task generalization is achieved through a human-object interaction graph, and skills are transferred to different robots via embodiment-specific kinematic motion retargeting and dynamic fine-tuning. Our framework is validated on five humanoid robots with diverse configurations, demonstrating stable loco-manipulation and highlighting its effectiveness in reducing data requirements and increasing the efficiency of skill transfer across platforms.

arxiv情報

著者 Junjia Liu,Zhuo Li,Minghao Yu,Zhipeng Dong,Sylvain Calinon,Darwin Caldwell,Fei Chen
発行日 2024-12-19 18:41:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク