要約
この記事では、燃料または飛行時間の制約のある基地に最初に配備された 1 台の無人航空機が、同じ優先順位で一連の目標を繰り返し訪問する必要がある持続的な監視ミッションに取り組むための、深層強化学習ベースのアプローチを紹介します。
車両の燃料または飛行時間の制約により、定期的に車両に燃料を補給するか、車両基地でバッテリーを再充電する必要があります。
この問題の目的は、車両の燃料や充電が切れないようにして、目標への連続訪問間の最大経過時間を最小化する、目標への最適な訪問順序を決定することです。
我々は、この問題を解決するための深層強化学習アルゴリズムを提示し、常識的な貪欲ヒューリスティックと比較してこのアプローチの有効性を裏付ける数値実験の結果を提示します。
要約(オリジナル)
This article presents a deep reinforcement learning-based approach to tackle a persistent surveillance mission requiring a single unmanned aerial vehicle initially stationed at a depot with fuel or time-of-flight constraints to repeatedly visit a set of targets with equal priority. Owing to the vehicle’s fuel or time-of-flight constraints, the vehicle must be regularly refueled, or its battery must be recharged at the depot. The objective of the problem is to determine an optimal sequence of visits to the targets that minimizes the maximum time elapsed between successive visits to any target while ensuring that the vehicle never runs out of fuel or charge. We present a deep reinforcement learning algorithm to solve this problem and present the results of numerical experiments that corroborate the effectiveness of this approach in comparison with common-sense greedy heuristics.
arxiv情報
著者 | Hritik Bana,Manav Mishra,Saswata Sarkar,Sujeevraja Sanjeevi,Sujit PB,Kaarthik Sundar |
発行日 | 2024-04-09 16:14:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google