要約
無人水上車両(USV)の展開の増加には、海事捜索救助などのアプリケーションでの計算サポートとカバレッジが必要です。
無人航空機(UAV)は低コストで柔軟な航空サービスを提供でき、地上局(GSS)は強力なサポートを提供できます。これは、複雑なシナリオでUSVを支援するために協力できます。
ただし、USVSのUAVとGSSのコラボレーションは、タスクの不確実性、USVS軌道の不確実性、不均一性、および限られた計算リソースの課題に直面しています。
これらの問題に対処するために、USVSが計算タスクの完了を支援するために、協同組合UAVおよびGSベースの堅牢なマルチアクセスエッジコンピューティングフレームワークを提案します。
具体的には、合計実行時間を最小限に抑えるための共同タスクのオフロードとUAV軌道の最適化問題を策定します。これは、混合整数非線形プログラミングとNPハードの形式です。
したがって、生成的人工知能強化不均一なエージェント近位政策最適化(GAI-HAPPO)のアルゴリズムを提案します。
提案されたアルゴリズムは、GAIモデルを統合して、アクターネットワークの複雑な環境をモデル化し、高レベルの機能を抽出する能力を高め、それによりアルゴリズムが不確実性を予測し、動的条件に適応できるようにします。
さらに、GAIは批評家ネットワークを安定させ、マルチエージェント強化学習アプローチの不安定性に対処します。
最後に、広範なシミュレーションは、提案されたアルゴリズムが既存のベンチマークメソッドを上回ることを示しており、したがって、考慮されたシナリオで複雑でドメインの問題に取り組む可能性を強調しています。
要約(オリジナル)
The increasing deployment of unmanned surface vehicles (USVs) require computational support and coverage in applications such as maritime search and rescue. Unmanned aerial vehicles (UAVs) can offer low-cost, flexible aerial services, and ground stations (GSs) can provide powerful supports, which can cooperate to help the USVs in complex scenarios. However, the collaboration between UAVs and GSs for USVs faces challenges of task uncertainties, USVs trajectory uncertainties, heterogeneities, and limited computational resources. To address these issues, we propose a cooperative UAV and GS based robust multi-access edge computing framework to assist USVs in completing computational tasks. Specifically, we formulate the optimization problem of joint task offloading and UAV trajectory to minimize the total execution time, which is in the form of mixed integer nonlinear programming and NP-hard to tackle. Therefore, we propose the algorithm of generative artificial intelligence-enhanced heterogeneous agent proximal policy optimization (GAI-HAPPO). The proposed algorithm integrates GAI models to enhance the actor network ability to model complex environments and extract high-level features, thereby allowing the algorithm to predict uncertainties and adapt to dynamic conditions. Additionally, GAI stabilizes the critic network, addressing the instability of multi-agent reinforcement learning approaches. Finally, extensive simulations demonstrate that the proposed algorithm outperforms the existing benchmark methods, thus highlighting the potentials in tackling intricate, cross-domain issues in the considered scenarios.
arxiv情報
著者 | Jiahao You,Ziye Jia,Chao Dong,Qihui Wu,Zhu Han |
発行日 | 2025-02-12 04:42:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google