A Scalable Decentralized Reinforcement Learning Framework for UAV Target Localization Using Recurrent PPO

要約

無人航空機 (UAV) の急速な進歩により、環境モニタリング、災害対応、農業測量など、数多くの用途が可能になりました。
複数の分散型 UAV の集合的な動作を強化すると、より効率的で調整された運用を通じてこれらのアプリケーションを大幅に改善できます。
この研究では、GNSS/GPS 信号のない場所など、知覚的に劣化した環境におけるターゲットの位置特定のためのリカレント PPO モデルを調査します。
私たちはまず、ターゲット識別のための単一ドローン アプローチを開発し、次に分散型 2 ドローン モデルを開発しました。
私たちのアプローチでは、UAV 上の 2 種類のセンサー、検出センサーとターゲット信号センサーを利用できます。
単一ドローン モデルは 93% の精度を達成しましたが、2 ドローン モデルは 86% の精度を達成しました。後者はターゲットの位置を特定するために必要な平均ステップが少なくなりました。
これは、UAV の群れにおける私たちの方法の可能性を示しており、複雑な環境条件で放射ターゲットの効率的かつ効果的な位置特定を提供します。

要約(オリジナル)

The rapid advancements in unmanned aerial vehicles (UAVs) have unlocked numerous applications, including environmental monitoring, disaster response, and agricultural surveying. Enhancing the collective behavior of multiple decentralized UAVs can significantly improve these applications through more efficient and coordinated operations. In this study, we explore a Recurrent PPO model for target localization in perceptually degraded environments like places without GNSS/GPS signals. We first developed a single-drone approach for target identification, followed by a decentralized two-drone model. Our approach can utilize two types of sensors on the UAVs, a detection sensor and a target signal sensor. The single-drone model achieved an accuracy of 93%, while the two-drone model achieved an accuracy of 86%, with the latter requiring fewer average steps to locate the target. This demonstrates the potential of our method in UAV swarms, offering efficient and effective localization of radiant targets in complex environmental conditions.

arxiv情報

著者 Leon Fernando,Billy Pik Lik Lau,Chau Yuen,U-Xuan Tan
発行日 2024-12-09 06:08:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, I.2.9 パーマリンク