要約
自律型モビリティは、貨物と乗客を移動させるための都市交通の新しいモードとして台頭しています。
ただし、このようなフリート調整スキームは、運用範囲、容量、および通信機能が異なる急速に成長するフリートのサイズに対応するためのスケーリングにおいて、大きな課題に直面しています。
部分的に観測可能な高度なエア モビリティ ゲームの概念を導入して、商用モビリティ フリートに固有の不均一性と自己利益を説明する航空機エージェントのフリートを調整します。
モビリティ システム内のエージェント間およびエージェント内の関係に起因する一般化可能な確率的ポリシーを構築するために、新しい異種グラフ注意ベースのエンコーダー/デコーダー (HetGAT Enc-Dec) ニューラル ネットワークを提案します。
深いマルチエージェント強化学習を活用してポリシーをトレーニングし、ローカルの観測を使用してエージェントの分散型意思決定を可能にします。
大規模な実験を通じて、HetGAT Enc-Dec ポリシーの下で動作するフリートは、オンデマンド モビリティ ネットワークで最高のフリート報酬と履行率を達成することにより、他の最先端のグラフ ニューラル ネットワーク ベースのポリシーよりも優れていることを示しています。
要約(オリジナル)
Autonomous mobility is emerging as a new mode of urban transportation for moving cargo and passengers. However, such fleet coordination schemes face significant challenges in scaling to accommodate fast-growing fleet sizes that vary in their operational range, capacity, and communication capabilities. We introduce the concept of partially observable advanced air mobility games to coordinate a fleet of aerial vehicle agents accounting for their heterogeneity and self-interest inherent to commercial mobility fleets. We propose a novel heterogeneous graph attention-based encoder-decoder (HetGAT Enc-Dec) neural network to construct a generalizable stochastic policy stemming from the inter- and intra-agent relations within the mobility system. We train our policy by leveraging deep multi-agent reinforcement learning, allowing decentralized decision-making for the agents using their local observations. Through extensive experimentation, we show that the fleets operating under the HetGAT Enc-Dec policy outperform other state-of-the-art graph neural network-based policies by achieving the highest fleet reward and fulfillment ratios in an on-demand mobility network.
arxiv情報
著者 | Malintha Fernando,Ransalu Senanayake,Heeyoul Choi,Martin Swany |
発行日 | 2023-02-16 18:09:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google