要約
マルチエージェント システムにおけるエージェント間の調整は、多くの分野で人気のトピックになっています。
エージェント間の内部関係を把握するために、グラフ構造を既存の手法と組み合わせて結果を改善します。
しかし、多数のエージェントを伴う大規模なタスクでは、グラフが複雑すぎると計算コストが増大し、パフォーマンスが低下する可能性があります。
ここでは、新しいグラフベースの値因数分解手法である DAGMIX を紹介します。
DAGMIX は、完全なグラフの代わりに、トレーニング中の各タイム ステップで動的グラフを生成し、その上で、アテンション メカニズムを通じて、より解釈しやすく効果的な結合プロセスを実現します。
実験では、DAGMIX が大規模シナリオで以前の SOTA 手法を大幅に上回るパフォーマンスを示し、他のタスクでも有望な結果を達成できることが示されています。
要約(オリジナル)
The coordination between agents in multi-agent systems has become a popular topic in many fields. To catch the inner relationship between agents, the graph structure is combined with existing methods and improves the results. But in large-scale tasks with numerous agents, an overly complex graph would lead to a boost in computational cost and a decline in performance. Here we present DAGMIX, a novel graph-based value factorization method. Instead of a complete graph, DAGMIX generates a dynamic graph at each time step during training, on which it realizes a more interpretable and effective combining process through the attention mechanism. Experiments show that DAGMIX significantly outperforms previous SOTA methods in large-scale scenarios, as well as achieving promising results on other tasks.
arxiv情報
著者 | Guangchong Zhou,Zhiwei Xu,Zeren Zhang,Guoliang Fan |
発行日 | 2023-12-07 12:02:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google