Graph Attention Multi-Agent Fleet Autonomy for Advanced Air Mobility

要約

自律型モビリティは、貨物と乗客を移動させるための都市交通の新しいモードとして台頭しています。
ただし、このようなフリート調整スキームは、運用範囲、容量、および通信機能が異なる急速に成長するフリートのサイズに対応するためのスケーリングにおいて、大きな課題に直面しています。
部分的に観測可能な高度なエア モビリティ ゲームの概念を導入して、商用モビリティ フリートに固有の不均一性と自己利益を説明する航空機エージェントのフリートを調整します。
モビリティ システム内のエージェント間およびエージェント内の関係に起因する一般化可能な確率的ポリシーを構築するために、新しい異種グラフ注意ベースのエンコーダー/デコーダー (HetGAT Enc-Dec) ニューラル ネットワークを提案します。
深いマルチエージェント強化学習を活用してポリシーをトレーニングし、ローカルの観測を使用してエージェントの分散型意思決定を可能にします。
大規模な実験を通じて、HetGAT Enc-Dec ポリシーの下で動作するフリートは、オンデマンド モビリティ ネットワークで最高のフリート報酬と履行率を達成することにより、他の最先端のグラフ ニューラル ネットワーク ベースのポリシーよりも優れていることを示しています。

要約(オリジナル)

Autonomous mobility is emerging as a new mode of urban transportation for moving cargo and passengers. However, such fleet coordination schemes face significant challenges in scaling to accommodate fast-growing fleet sizes that vary in their operational range, capacity, and communication capabilities. We introduce the concept of partially observable advanced air mobility games to coordinate a fleet of aerial vehicle agents accounting for their heterogeneity and self-interest inherent to commercial mobility fleets. We propose a novel heterogeneous graph attention-based encoder-decoder (HetGAT Enc-Dec) neural network to construct a generalizable stochastic policy stemming from the inter- and intra-agent relations within the mobility system. We train our policy by leveraging deep multi-agent reinforcement learning, allowing decentralized decision-making for the agents using their local observations. Through extensive experimentation, we show that the fleets operating under the HetGAT Enc-Dec policy outperform other state-of-the-art graph neural network-based policies by achieving the highest fleet reward and fulfillment ratios in an on-demand mobility network.

arxiv情報

著者 Malintha Fernando,Ransalu Senanayake,Heeyoul Choi,Martin Swany
発行日 2023-02-16 18:09:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.MA, cs.RO パーマリンク