要約
本稿では、通信制約下で動作する異種マルチエージェントシステムにおける分散タスク割り当ての課題に取り組む。本論文では、グラフニューラルネットワーク(GNN)を集中学習・分散実行(CTDE)パラダイムと統合し、さらにマルチエージェント深層強化学習(MARL)のために調整された近位政策最適化(PPO)アルゴリズムによって強化された新しいフレームワークを紹介する。我々のアプローチは、無人航空機(UAV)と無人地上車両(UGV)が、3Dグリッド環境において中央調整を必要とすることなく、動的に効率的にタスクを割り当てることを可能にする。このフレームワークは、タスク割り当てにおける競合を回避すると同時に、総移動時間を最小化する。コスト計算と経路決定には、予約ベースのA*とR*経路計画器を用いる。実験の結果、本手法は92.5%という高い無競合成功率を達成し、中央集権的なハンガリー法に比べて7.49%の性能差しかなく、貪欲なアプローチに基づくヒューリスティックな分散型ベースラインを凌駕している。さらに、本フレームワークは、最大20エージェント、2.8秒の割り当て処理というスケーラビリティと、動的に生成されるタスクに対する頑健性を示し、複雑なマルチエージェントシナリオにおける実世界への応用の可能性を強調している。
要約(オリジナル)
This paper addresses the challenge of decentralized task allocation within heterogeneous multi-agent systems operating under communication constraints. We introduce a novel framework that integrates graph neural networks (GNNs) with a centralized training and decentralized execution (CTDE) paradigm, further enhanced by a tailored Proximal Policy Optimization (PPO) algorithm for multi-agent deep reinforcement learning (MARL). Our approach enables unmanned aerial vehicles (UAVs) and unmanned ground vehicles (UGVs) to dynamically allocate tasks efficiently without necessitating central coordination in a 3D grid environment. The framework minimizes total travel time while simultaneously avoiding conflicts in task assignments. For the cost calculation and routing, we employ reservation-based A* and R* path planners. Experimental results revealed that our method achieves a high 92.5% conflict-free success rate, with only a 7.49% performance gap compared to the centralized Hungarian method, while outperforming the heuristic decentralized baseline based on greedy approach. Additionally, the framework exhibits scalability with up to 20 agents with allocation processing of 2.8 s and robustness in responding to dynamically generated tasks, underscoring its potential for real-world applications in complex multi-agent scenarios.
arxiv情報
著者 | Lavanya Ratnabala,Aleksey Fedoseev,Robinroy Peter,Dzmitry Tsetserukou |
発行日 | 2025-02-04 13:29:56+00:00 |
arxivサイト | arxiv_id(pdf) |