要約
この研究では、ドローン送達の問題をコントロールの問題として定式化し、モデル予測制御を使用して解決します。
2つの実験が実行されます。1つ目は、次元が低いほど挑戦的ではないグリッドの世界環境で、2つ目はより高い次元と複雑さを追加することです。
MPCメソッドは、3つの一般的なマルチエージェント補強学習(MARL)に対してベンチマークされました:独立$ Q $ -Learning(IQL)、共同アクション学習者(JAL)、およびバリューデコムポジションネットワーク(VDN)。
MPCメソッドが問題をより迅速に解決し、最小化コストを達成し、最適なパスをナビゲートするために最適なドローンをより少なくする必要があることが示されました。
要約(オリジナル)
In this study, we formulate the drone delivery problem as a control problem and solve it using Model Predictive Control. Two experiments are performed: The first is on a less challenging grid world environment with lower dimensionality, and the second is with a higher dimensionality and added complexity. The MPC method was benchmarked against three popular Multi-Agent Reinforcement Learning (MARL): Independent $Q$-Learning (IQL), Joint Action Learners (JAL), and Value-Decomposition Networks (VDN). It was shown that the MPC method solved the problem quicker and required fewer optimal numbers of drones to achieve a minimized cost and navigate the optimal path.
arxiv情報
著者 | Muhammad Al-Zafar Khan,Jamal Al-Karaki |
発行日 | 2025-03-25 14:27:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google