On the Robustness of Object Detection Models in Aerial Images

要約

物体検出モデルの堅牢性は、現実世界のシナリオに適用する場合に大きな懸念事項となります。
ただし、ほとんどの物体検出モデルは、通常、クリーンなデータセットでトレーニングおよび評価されるため、破損した画像に適用するとパフォーマンスが低下します。
物体検出モデルの堅牢性を強化することは、複雑な背景、物体のスケールや方向の大幅な変化を特徴とする航空画像用に設計されたモデルでは特に重要です。
このペーパーでは、航空画像における物体検出モデルの堅牢性を評価するという課題について、特に画像が雲の影響を受けるシナリオに重点を置いて説明します。
この調査では、DOTA-v1.0 に基づく 2 つの新しいベンチマークを紹介します。
最初のベンチマークは一般的な 19 件の破損を網羅し、2 番目のベンチマークは雲による破損画像に焦点を当てています。この現象は、自然写真では珍しいものの、航空写真ではよく見られます。
私たちは主流の物体検出モデルの堅牢性を系統的に評価し、多数のアブレーション実験を実施しています。
私たちの調査を通じて、強化されたモデル アーキテクチャ、大規模なネットワーク、巧妙に作成されたモジュール、賢明なデータ拡張戦略が総合的に航空物体検出モデルの堅牢性を向上させることがわかりました。
私たちが提案するベンチマークと包括的な実験分析により、航空画像における堅牢な物体検出の研究が促進されます。
コードとデータセットは次から入手できます: (https://github.com/hehaodong530/DOTA-C)

要約(オリジナル)

The robustness of object detection models is a major concern when applied to real-world scenarios. However, the performance of most object detection models degrades when applied to images subjected to corruptions, since they are usually trained and evaluated on clean datasets. Enhancing the robustness of object detection models is of utmost importance, especially for those designed for aerial images, which feature complex backgrounds, substantial variations in scales and orientations of objects. This paper addresses the challenge of assessing the robustness of object detection models in aerial images, with a specific emphasis on scenarios where images are affected by clouds. In this study, we introduce two novel benchmarks based on DOTA-v1.0. The first benchmark encompasses 19 prevalent corruptions, while the second focuses on cloud-corrupted images-a phenomenon uncommon in natural pictures yet frequent in aerial photography. We systematically evaluate the robustness of mainstream object detection models and perform numerous ablation experiments. Through our investigations, we find that enhanced model architectures, larger networks, well-crafted modules, and judicious data augmentation strategies collectively enhance the robustness of aerial object detection models. The benchmarks we propose and our comprehensive experimental analyses can facilitate research on robust object detection in aerial images. Codes and datasets are available at: (https://github.com/hehaodong530/DOTA-C)

arxiv情報

著者 Haodong He,Jian Ding,Gui-Song Xia
発行日 2023-08-29 15:16:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク