Monocular Obstacle Avoidance Based on Inverse PPO for Fixed-wing UAVs

要約

固定翼無人航空機 (UAV) は、その長時間の耐久性と高速機能により、急成長する低空経済 (LAE) および都市航空モビリティ (UAM) で最も一般的に使用されるプラットフォームの 1 つです。
従来の地図や高度なセンサーに依存する従来の障害物回避システムは、未知の低高度環境や小型 UAV プラットフォームでは限界に直面しています。
これに応えて、この論文では、搭載された視覚センサーのみを使用して、固定翼 UAV が 30m/s 以上の巡航速度で未知の障害物を回避できるようにする、軽量の深層強化学習 (DRL) ベースの UAV 衝突回避システムを提案します。
提案されたシステムは、合理化されたネットワーク アーキテクチャを備えた単一フレーム画像深度推論モジュールを採用し、エッジ コンピューティング デバイス向けに最適化されたリアルタイムの障害物検出を保証します。
その後、新しい報酬関数を備えた強化学習コントローラーが、ターゲットへのアプローチと飛行軌道の滑らかさのバランスをとり、固定翼 UAV プラットフォームの特定の動的制約と安定性要件を満たすように設計されます。
DRL に固有の探索と活用のトレードオフを軽減するために、適応エントロピー調整メカニズムが導入され、トレーニングの収束と障害物回避の成功率が向上します。
広範なソフトウェアインザループおよびハードウェアインザループの実験により、提案されたフレームワークが障害物回避効率と飛行軌道の滑らかさにおいて他の方法よりも優れていることが実証され、エッジデバイス上でのアルゴリズムの実装の実現可能性が確認されました。
ソース コードは \url{https://github.com/ch9397/FixedWing-MonoPPO} で公開されています。

要約(オリジナル)

Fixed-wing Unmanned Aerial Vehicles (UAVs) are one of the most commonly used platforms for the burgeoning Low-altitude Economy (LAE) and Urban Air Mobility (UAM), due to their long endurance and high-speed capabilities. Classical obstacle avoidance systems, which rely on prior maps or sophisticated sensors, face limitations in unknown low-altitude environments and small UAV platforms. In response, this paper proposes a lightweight deep reinforcement learning (DRL) based UAV collision avoidance system that enables a fixed-wing UAV to avoid unknown obstacles at cruise speed over 30m/s, with only onboard visual sensors. The proposed system employs a single-frame image depth inference module with a streamlined network architecture to ensure real-time obstacle detection, optimized for edge computing devices. After that, a reinforcement learning controller with a novel reward function is designed to balance the target approach and flight trajectory smoothness, satisfying the specific dynamic constraints and stability requirements of a fixed-wing UAV platform. An adaptive entropy adjustment mechanism is introduced to mitigate the exploration-exploitation trade-off inherent in DRL, improving training convergence and obstacle avoidance success rates. Extensive software-in-the-loop and hardware-in-the-loop experiments demonstrate that the proposed framework outperforms other methods in obstacle avoidance efficiency and flight trajectory smoothness and confirm the feasibility of implementing the algorithm on edge devices. The source code is publicly available at \url{https://github.com/ch9397/FixedWing-MonoPPO}.

arxiv情報

著者 Haochen Chai,Meimei Su,Yang Lyu,Zhunga Liu,Chunhui Zhao,Quan Pan
発行日 2024-11-27 03:03:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク