要約
マルチエージェント パスファインディング (MAPF) 問題は、既知の環境内でエージェントのチームが現在の位置から事前に設定された目標まで衝突のない経路を探索する問題であり、多くの物流、輸送、およびサービスの中核に見られる重要な問題です。
一般的なロボットアプリケーション。
既存の学習ベースの MAPF アプローチでは、通常、ポリシー ネットワークの入力ディメンションを修正するための自然な手段として、各エージェントはその位置の周囲の限られた視野 (FOV) に基づいて意思決定を行うことしかできません。
ただし、エージェントには視野外の障害物やエージェントを認識して計画する能力がないため、これによりポリシーが近視眼的になることがよくあります。
この課題に対処するために、私たちは ALPHA を提案します。これは、グラウンド トゥルースの近位 (ローカル) 情報とファジー遠位 (グローバル) 情報の使用を組み合わせた新しいフレームワークで、エージェントがシステムの完全な現在の状態に基づいてローカルな決定を順序立て、そのような近視眼的な状況を回避できるようにします。
。
さらに、エージェントが互いのパスの意図を推論する手段として、互いのパスについて短期予測を行えるようにし、それによってシステム全体のレベルでエージェント間の協力レベルを向上させます。
私たちのニューラル構造はグラフ トランスフォーマー アーキテクチャに依存しており、エージェントがこれらのさまざまな情報ソースを選択的に組み合わせ、さまざまな空間スケールでの相互依存関係について推論できるようになります。
私たちのシミュレーション実験では、ALPHA がグローバルにガイドされた MAPF ソルバーと通信学習ベースのソルバーの両方を上回るパフォーマンスを示し、現実的な展開におけるスケーラビリティに対する潜在力を示しています。
要約(オリジナル)
The multi-agent pathfinding (MAPF) problem seeks collision-free paths for a team of agents from their current positions to their pre-set goals in a known environment, and is an essential problem found at the core of many logistics, transportation, and general robotics applications. Existing learning-based MAPF approaches typically only let each agent make decisions based on a limited field-of-view (FOV) around its position, as a natural means to fix the input dimensions of its policy network. However, this often makes policies short-sighted, since agents lack the ability to perceive and plan for obstacles/agents beyond their FOV. To address this challenge, we propose ALPHA, a new framework combining the use of ground truth proximal (local) information and fuzzy distal (global) information to let agents sequence local decisions based on the full current state of the system, and avoid such myopicity. We further allow agents to make short-term predictions about each others’ paths, as a means to reason about each others’ path intentions, thereby enhancing the level of cooperation among agents at the whole system level. Our neural structure relies on a Graph Transformer architecture to allow agents to selectively combine these different sources of information and reason about their inter-dependencies at different spatial scales. Our simulation experiments demonstrate that ALPHA outperforms both globally-guided MAPF solvers and communication-learning based ones, showcasing its potential towards scalability in realistic deployments.
arxiv情報
著者 | Chengyang He,Tianze Yang,Tanishq Duhan,Yutong Wang,Guillaume Sartoretti |
発行日 | 2023-10-12 14:18:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google