Deep Reinforcement Learning-Based Approach for a Single Vehicle Persistent Surveillance Problem with Fuel Constraints

要約

本論文では、燃料または飛行時間の制約があるデポに最初に配置された1台の無人航空機が、優先順位の等しいターゲットのセットを繰り返し訪問することを必要とする永続的な監視ミッションに取り組むための、深層強化学習に基づくアプローチを示す。燃料または飛行時間に制約があるため、ビークルは定期的に燃料を補給するか、バッテリーをデポで充電しなければならない。この問題の目的は、車両が燃料切れや充電切れを起こさないようにしながら、任意のターゲットへの連続的な訪問間の最大経過時間を最小化する、ターゲットへの最適な訪問順序を決定することである。我々は、この問題を解くための深層強化学習アルゴリズムを提示し、常識的な貪欲なヒューリスティクスと比較して、このアプローチの有効性を裏付ける数値実験の結果を示す。

要約(オリジナル)

This article presents a deep reinforcement learning-based approach to tackle a persistent surveillance mission requiring a single unmanned aerial vehicle initially stationed at a depot with fuel or time-of-flight constraints to repeatedly visit a set of targets with equal priority. Owing to the vehicle’s fuel or time-of-flight constraints, the vehicle must be regularly refueled, or its battery must be recharged at the depot. The objective of the problem is to determine an optimal sequence of visits to the targets that minimizes the maximum time elapsed between successive visits to any target while ensuring that the vehicle never runs out of fuel or charge. We present a deep reinforcement learning algorithm to solve this problem and present the results of numerical experiments that corroborate the effectiveness of this approach in comparison with common-sense greedy heuristics.

arxiv情報

著者 Manav Mishra,Hritik Bana,Saswata Sarkar,Sujeevraja Sanjeevi,PB Sujit,Kaarthik Sundar
発行日 2024-05-03 02:05:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク