トレーニング中に、密度クロップが特定され、新しいクラスとしてラベル付けされ、トレーニング データセットを補強するために使用されます。
推論中、最初に密度トリミングが基本クラス オブジェクトと共に検出され、次に推論の第 2 段階に入力されます。
このアプローチは、任意の検出器に簡単に統合でき、航空画像検出で一般的な均一クロッピング アプローチのように、標準的な検出プロセスに大きな変化をもたらすことはありません。
挑戦的な VisDrone および DOTA データセットの航空画像に関する実験結果は、提案されたアプローチの利点を検証します。
提案された CZ 検出器は、VisDrone データセットの均一クロッピングおよびその他の密度クロッピング方法よりも最先端の結果を提供し、小さなオブジェクトの検出 mAP を 3 ポイント以上増加させます。
Detecting objects in aerial images is challenging because they are typically composed of crowded small objects distributed non-uniformly over high-resolution images. Density cropping is a widely used method to improve this small object detection where the crowded small object regions are extracted and processed in high resolution. However, this is typically accomplished by adding other learnable components, thus complicating the training and inference over a standard detection process. In this paper, we propose an efficient Cascaded Zoom-in (CZ) detector that re-purposes the detector itself for density-guided training and inference. During training, density crops are located, labeled as a new class, and employed to augment the training dataset. During inference, the density crops are first detected along with the base class objects, and then input for a second stage of inference. This approach is easily integrated into any detector, and creates no significant change in the standard detection process, like the uniform cropping approach popular in aerial image detection. Experimental results on the aerial images of the challenging VisDrone and DOTA datasets verify the benefits of the proposed approach. The proposed CZ detector also provides state-of-the-art results over uniform cropping and other density cropping methods on the VisDrone dataset, increasing the detection mAP of small objects by more than 3 points.
著者 | Akhil Meethal,Eric Granger,Marco Pedersoli |
発行日 | 2023-03-15 16:39:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google