要約
人型ロボットによる部屋の掃除を可能にすることは、人型研究コミュニティ内で長年追い求められてきた夢でした。
ただし、大きくて重い家具を一緒に運ぶなど、多くの作業では複数の人型ロボットの協力が必要です。
マルチ ヒューマノイドのコラボレーションに関するモーション キャプチャ データの不足と、マルチ エージェントの学習に関連する効率の課題を考慮すると、これらのタスクは、シングル エージェント シナリオ向けに設計されたトレーニング パラダイムを使用して直接対処することはできません。
この論文では、個人のスキルの学習とその後のポリシーの移転という 2 段階の学習パラダイムを通じて、複数の人型オブジェクトの輸送問題の課題に取り組むように設計されたフレームワークである、Cooperative Human-Object Interaction (CooHOI) を紹介します。
まず、1 人のヒューマノイド キャラクターが、人間の事前動作からの模倣学習を通じてオブジェクトと対話することを学習します。
次に、ヒューマノイドは、集中トレーニングおよび分散実行 (CTDE) マルチエージェント RL アルゴリズムを使用して、操作対象オブジェクトの共有ダイナミクスを考慮することで、他の人と協力することを学習します。
1 つのエージェントがオブジェクトと対話し、その結果特定のオブジェクトのダイナミクスが変化すると、他のエージェントは適切に応答することを学習し、それによってチームメイト間の暗黙的なコミュニケーションと調整が実現します。
マルチ ヒューマノイド HOI の追跡ベースの方法に依存した以前のアプローチとは異なり、CooHOI は本質的に効率的であり、マルチ ヒューマノイド インタラクションのモーション キャプチャ データに依存せず、より多くの参加者と幅広いオブジェクト タイプを含めるようにシームレスに拡張できます。
。
要約(オリジナル)
Enabling humanoid robots to clean rooms has long been a pursued dream within humanoid research communities. However, many tasks require multi-humanoid collaboration, such as carrying large and heavy furniture together. Given the scarcity of motion capture data on multi-humanoid collaboration and the efficiency challenges associated with multi-agent learning, these tasks cannot be straightforwardly addressed using training paradigms designed for single-agent scenarios. In this paper, we introduce Cooperative Human-Object Interaction (CooHOI), a framework designed to tackle the challenge of multi-humanoid object transportation problem through a two-phase learning paradigm: individual skill learning and subsequent policy transfer. First, a single humanoid character learns to interact with objects through imitation learning from human motion priors. Then, the humanoid learns to collaborate with others by considering the shared dynamics of the manipulated object using centralized training and decentralized execution (CTDE) multi-agent RL algorithms. When one agent interacts with the object, resulting in specific object dynamics changes, the other agents learn to respond appropriately, thereby achieving implicit communication and coordination between teammates. Unlike previous approaches that relied on tracking-based methods for multi-humanoid HOI, CooHOI is inherently efficient, does not depend on motion capture data of multi-humanoid interactions, and can be seamlessly extended to include more participants and a wide range of object types.
arxiv情報
著者 | Jiawei Gao,Ziqin Wang,Zeqi Xiao,Jingbo Wang,Tai Wang,Jinkun Cao,Xiaolin Hu,Si Liu,Jifeng Dai,Jiangmiao Pang |
発行日 | 2024-10-30 02:58:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google