Boost UAV-based Ojbect Detection via Scale-Invariant Feature Disentanglement and Adversarial Learning

要約

無人航空機 (UAV) からの物体の検出は、多数の小さな物体によって妨げられることが多く、その結果、検出精度が低くなります。
この問題に対処するために、主流のアプローチでは通常、多段階の推論が利用されます。
驚くべき検出精度にもかかわらず、リアルタイム効率が犠牲になり、実際のアプリケーションを処理するのは実用的ではありません。
この目的を達成するために、スケール不変の特徴を学習することで単一段階の推論精度を向上させることを提案します。
具体的には、スケール不変特徴分離モジュールは、スケール関連特徴とスケール不変特徴のもつれを解消するように設計されています。
次に、敵対的特徴学習スキームを使用して、もつれの解消を強化します。
最後に、スケール不変の機能を利用して、堅牢な UAV ベースの物体検出を実現します。
さらに、注釈付きの UAV 状態パラメーターを組み込んだマルチモーダル UAV 物体検出データセット State-Air を構築します。
私たちは、2 つのベンチマーク データセット上の 3 つの軽量検出フレームワークにアプローチを適用します。
広範な実験により、私たちのアプローチがモデルの精度を効果的に向上させ、2 つのデータセットで最先端 (SoTA) のパフォーマンスを達成できることが実証されました。
論文が受理され次第、私たちのコードとデータセットは一般公開されます。

要約(オリジナル)

Detecting objects from Unmanned Aerial Vehicles (UAV) is often hindered by a large number of small objects, resulting in low detection accuracy. To address this issue, mainstream approaches typically utilize multi-stage inferences. Despite their remarkable detecting accuracies, real-time efficiency is sacrificed, making them less practical to handle real applications. To this end, we propose to improve the single-stage inference accuracy through learning scale-invariant features. Specifically, a Scale-Invariant Feature Disentangling module is designed to disentangle scale-related and scale-invariant features. Then an Adversarial Feature Learning scheme is employed to enhance disentanglement. Finally, scale-invariant features are leveraged for robust UAV-based object detection. Furthermore, we construct a multi-modal UAV object detection dataset, State-Air, which incorporates annotated UAV state parameters. We apply our approach to three lightweight detection frameworks on two benchmark datasets. Extensive experiments demonstrate that our approach can effectively improve model accuracy and achieve state-of-the-art (SoTA) performance on two datasets. Our code and dataset will be publicly available once the paper is accepted.

arxiv情報

著者 Fan Liu,Liang Yao,Chuanyi Zhang,Ting Wu,Xinlei Zhang,Xiruo Jiang,Jun Zhou
発行日 2024-12-27 08:57:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク