要約
混雑した環境におけるマルチエージェント パス検索 (MAPF) は、システム内のすべてのエージェントの衝突のないパスを見つけることを目的とした動作計画において、困難な問題を引き起こします。
MAPF は、空中群集、自律型倉庫ロボット工学、自動運転車など、さまざまな分野で幅広い用途に使用されています。
MAPF に対する現在のアプローチは、一般に、集中型計画と分散型計画という 2 つの主要なカテゴリに分類されます。
集中計画は、エージェントまたは状態の数が増加すると次元の呪いに悩まされるため、大規模で複雑な環境ではうまく拡張できません。
一方、分散型計画では、エージェントは部分的に観測可能な環境内でリアルタイムの経路計画に従事でき、暗黙的な調整が実証されます。
ただし、密集した環境では、収束が遅く、パフォーマンスが低下するという問題があります。
この論文では、グラフ ニューラル ネットワーク (GNN) を介してエージェント間の効率的なローカル通信を可能にし、混雑した環境での状況認識と意思決定能力を促進することで、この問題に対処する新しいクラウドアウェア分散強化学習アプローチである CRAMP を紹介します。
私たちはシミュレートされた環境で CRAMP をテストし、私たちの方法がさまざまな指標で MAPF の最先端の分散型方法よりも優れていることを実証します。
CRAMP は、以前の方法と比較して、メイクスパンと衝突回数で測定したソリューションの品質を最大 59% 向上させ、成功率を最大 35% 向上させました。
要約(オリジナル)
Multi-Agent Path Finding (MAPF) in crowded environments presents a challenging problem in motion planning, aiming to find collision-free paths for all agents in the system. MAPF finds a wide range of applications in various domains, including aerial swarms, autonomous warehouse robotics, and self-driving vehicles. Current approaches to MAPF generally fall into two main categories: centralized and decentralized planning. Centralized planning suffers from the curse of dimensionality when the number of agents or states increases and thus does not scale well in large and complex environments. On the other hand, decentralized planning enables agents to engage in real-time path planning within a partially observable environment, demonstrating implicit coordination. However, they suffer from slow convergence and performance degradation in dense environments. In this paper, we introduce CRAMP, a novel crowd-aware decentralized reinforcement learning approach to address this problem by enabling efficient local communication among agents via Graph Neural Networks (GNNs), facilitating situational awareness and decision-making capabilities in congested environments. We test CRAMP on simulated environments and demonstrate that our method outperforms the state-of-the-art decentralized methods for MAPF on various metrics. CRAMP improves the solution quality up to 59% measured in makespan and collision count, and up to 35% improvement in success rate in comparison to previous methods.
arxiv情報
著者 | Phu Pham,Aniket Bera |
発行日 | 2024-08-09 00:39:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google