Enabling Multi-Robot Collaboration from Single-Human Guidance

要約

マルチエージェントシステムには、共同行動を学ぶことが不可欠です。
従来、マルチエージェントの強化学習は、共同報酬と集中的な観察を通じてこれを暗黙的に解決し、共同行動が出現すると仮定します。
他の研究では、共同専門家のグループのデモンストレーションから学ぶことを提案しています。
代わりに、単一の人間の専門知識を活用することにより、マルチエージェントシステムで共同行動を学ぶ効率的かつ明示的な方法を提案します。
私たちの洞察は、人間がチームで自然にさまざまな役割を引き受けることができるということです。
エージェントは、人間のオペレーターが制御エージェントを短時間動的に切り替え、チームメイトの人間のような理論モデルを組み込むことにより、コラボレーションを効果的に学ぶことができることを示しています。
私たちの実験は、私たちの方法が、挑戦的な協力的な隠れ家のタスクの成功率を最大58%改善し、わずか40分間の人間の指導を改善することを示しました。
さらに、マルチロボット実験を実施することにより、現実世界への調査結果の移転を実証します。

要約(オリジナル)

Learning collaborative behaviors is essential for multi-agent systems. Traditionally, multi-agent reinforcement learning solves this implicitly through a joint reward and centralized observations, assuming collaborative behavior will emerge. Other studies propose to learn from demonstrations of a group of collaborative experts. Instead, we propose an efficient and explicit way of learning collaborative behaviors in multi-agent systems by leveraging expertise from only a single human. Our insight is that humans can naturally take on various roles in a team. We show that agents can effectively learn to collaborate by allowing a human operator to dynamically switch between controlling agents for a short period and incorporating a human-like theory-of-mind model of teammates. Our experiments showed that our method improves the success rate of a challenging collaborative hide-and-seek task by up to 58% with only 40 minutes of human guidance. We further demonstrate our findings transfer to the real world by conducting multi-robot experiments.

arxiv情報

著者 Zhengran Ji,Lingyu Zhang,Paul Sajda,Boyuan Chen
発行日 2025-02-26 04:44:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, cs.MA, cs.RO パーマリンク