Multicopy Reinforcement Learning Agents

要約

この論文では、あるエージェントが単一のエージェントタスクをより良く、あるいはより効率的に達成するために、それ自身の同一のコピーを複数作成するという、新しいタイプのマルチエージェント問題を検討する。この戦略は、環境がノイジーであり、タスクが単一のエージェントコピーでは達成できない場合がある場合に、パフォーマンスを向上させる。我々は、このマルチコピー問題に対する学習アルゴリズムを提案する。この学習アルゴリズムは、価値関数の構造を利用して、コピーを追加する利点とコストのバランスを効率的に学習する。

要約(オリジナル)

This paper examines a novel type of multi-agent problem, in which an agent makes multiple identical copies of itself in order to achieve a single agent task better or more efficiently. This strategy improves performance if the environment is noisy and the task is sometimes unachievable by a single agent copy. We propose a learning algorithm for this multicopy problem which takes advantage of the structure of the value function to efficiently learn how to balance the advantages and costs of adding additional copies.

arxiv情報

著者 Alicia P. Wolfe,Oliver Diamond,Brigitte Goeler-Slough,Remi Feuerman,Magdalena Kisielinska,Victoria Manfredi
発行日 2024-05-06 12:43:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.MA パーマリンク