要約
本稿では、マルチエージェントシステムが過去の記憶を効果的に活用し、データ効率よく新しい協調タスクに適応できるようにすることを目的とする。我々は、マルチエージェント協調スキルデータベース(Multi-Agent Coordination Skill Database)を提案する。これは、協調行動のコレクションを、それらに特徴的なキーベクトルと関連付けて保存するためのリポジトリである。我々のTransformerベースのスキルエンコーダは、協調に寄与する時空間的相互作用を効果的に捉え、それぞれの協調行動に固有のスキル表現を提供する。ターゲットタスクの少数のデモンストレーションを活用することで、データベースは、検索されたデモンストレーションで補強されたデータセットを用いてポリシーを学習することを可能にする。実験評価により、本方法は、数発模倣学習のようなベースライン手法と比較して、プッシュ操作タスクにおいて有意に高い成功率を達成することが明確に示された。さらに、車輪型ロボットのチームを用いた実環境において、我々の検索学習フレームワークの有効性を検証する。
要約(オリジナル)
This paper aims to enable multi-agent systems to effectively utilize past memories to adapt to novel collaborative tasks in a data-efficient fashion. We propose the Multi-Agent Coordination Skill Database, a repository for storing a collection of coordinated behaviors associated with the key vector distinctive to them. Our Transformer-based skill encoder effectively captures spatio-temporal interactions that contribute to coordination and provide a skill representation unique to each coordinated behavior. By leveraging a small number of demonstrations of the target task, the database allows us to train the policy using a dataset augmented with the retrieved demonstrations. Experimental evaluations clearly demonstrate that our method achieves a significantly higher success rate in push manipulation tasks compared to baseline methods like few-shot imitation learning. Furthermore, we validate the effectiveness of our retrieve-and-learn framework in a real environment using a team of wheeled robots.
arxiv情報
著者 | So Kuroki,Mai Nishimura,Tadashi Kozuno |
発行日 | 2023-12-04 16:30:19+00:00 |
arxivサイト | arxiv_id(pdf) |