Graph Attention Multi-Agent Fleet Autonomy for Advanced Air Mobility

要約

自律型モビリティは、貨物や乗客を移動させるための新たな破壊的な都市交通モ​​ードとして台頭しています。
しかし、急速に成長するモビリティ システムに対応するスケーラブルな自律フリート調整スキームを設計することは、主にフリートの異質性の増大、時間変化する需要パターン、サービス エリアの拡大、および通信の制限により困難です。
我々は、相互作用するエージェントの異質性と商用モビリティフリートに固有の利己的な性質を考慮して、航空機フリートを調整する、部分的に観測可能な高度なエアモビリティゲームの概念を導入します。
エージェント間の複雑な相互作用とモビリティ ネットワークにおける観測の不確実性をモデル化するために、新しい異種グラフ アテンション エンコーダ/デコーダ (HetGAT Enc-Dec) ニューラル ネットワーク ベースの確率論的ポリシーを提案します。
深層マルチエージェント強化学習を活用してポリシーをトレーニングし、ローカル観察を使用したエージェントの分散型意思決定を可能にします。
広範な実験を通じて、学習されたポリシーがさまざまな艦隊構成、需要パターン、観測トポロジに一般化されることを示します。
さらに、HetGAT Enc-Dec ポリシーに基づいて動作するフリートは、オンデマンド モビリティ ネットワークで最高のフリート報酬とフルフィルメント率を達成することで、他の最先端のグラフ ニューラル ネットワーク ポリシーよりも優れたパフォーマンスを発揮します。

要約(オリジナル)

Autonomous mobility is emerging as a new disruptive mode of urban transportation for moving cargo and passengers. However, designing scalable autonomous fleet coordination schemes to accommodate fast-growing mobility systems is challenging primarily due to the increasing heterogeneity of the fleets, time-varying demand patterns, service area expansions, and communication limitations. We introduce the concept of partially observable advanced air mobility games to coordinate a fleet of aerial vehicles by accounting for the heterogeneity of the interacting agents and the self-interested nature inherent to commercial mobility fleets. To model the complex interactions among the agents and the observation uncertainty in the mobility networks, we propose a novel heterogeneous graph attention encoder-decoder (HetGAT Enc-Dec) neural network-based stochastic policy. We train the policy by leveraging deep multi-agent reinforcement learning, allowing decentralized decision-making for the agents using their local observations. Through extensive experimentation, we show that the learned policy generalizes to various fleet compositions, demand patterns, and observation topologies. Further, fleets operating under the HetGAT Enc-Dec policy outperform other state-of-the-art graph neural network policies by achieving the highest fleet reward and fulfillment ratios in on-demand mobility networks.

arxiv情報

著者 Malintha Fernando,Ransalu Senanayake,Heeyoul Choi,Martin Swany
発行日 2023-08-01 19:36:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.MA, cs.RO パーマリンク