Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset

要約

赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していることと、類似した背景の妨害物が豊富にあるため、独特の課題を引き起こします。
私たちは、背景のセマンティクスが、このタスクにおいて視覚的に類似したオブジェクトを区別する上で極めて重要な役割を果たすと主張します。
これに対処するために、クラスター化された赤外線小型ターゲット検出という新しいタスクを導入し、背景領域にピクセルごとのセマンティック アノテーションを提供する新しいベンチマーク データセットである DenseSIRST を紹介します。これにより、まばらなターゲット検出から密なターゲット検出への移行が可能になります。
このデータセットを活用して、背景認識機能交換ネットワーク (BAFE-Net) を提案します。これは、検出パラダイムを、前景に焦点を当てた単一タスクから、ターゲット検出と背景セマンティック セグメンテーションを共同で実行するマルチタスク アーキテクチャに変換します。
BAFE-Net では、2 つのタスク間にターゲット セマンティクスとバックグラウンド セマンティクスを埋め込むためのクロスタスク機能のハード交換メカニズムが導入されています。
さらに、背景を意識したガウス コピー アンド ペースト (BAG-CP) 手法を提案します。これは、トレーニング中に小さなターゲットを選択的に空の領域に貼り付け、複雑な非空の背景での誤った警報ターゲットの作成を回避します。
広範な実験により、BAG-CP と BAFE-Net が誤報を減らしながらターゲットの検出精度を向上させる効果を検証しています。
DenseSIRST データセット、コード、トレーニング済みモデルは、https://github.com/GrokCV/BAFE-Net で入手できます。

要約(オリジナル)

Infrared small target detection poses unique challenges due to the scarcity of intrinsic target features and the abundance of similar background distractors. We argue that background semantics play a pivotal role in distinguishing visually similar objects for this task. To address this, we introduce a new task — clustered infrared small target detection, and present DenseSIRST, a novel benchmark dataset that provides per-pixel semantic annotations for background regions, enabling the transition from sparse to dense target detection. Leveraging this dataset, we propose the Background-Aware Feature Exchange Network (BAFE-Net), which transforms the detection paradigm from a single task focused on the foreground to a multi-task architecture that jointly performs target detection and background semantic segmentation. BAFE-Net introduces a cross-task feature hard-exchange mechanism to embed target and background semantics between the two tasks. Furthermore, we propose the Background-Aware Gaussian Copy-Paste (BAG-CP) method, which selectively pastes small targets into sky regions during training, avoiding the creation of false alarm targets in complex non-sky backgrounds. Extensive experiments validate the effectiveness of BAG-CP and BAFE-Net in improving target detection accuracy while reducing false alarms. The DenseSIRST dataset, code, and trained models are available at https://github.com/GrokCV/BAFE-Net.

arxiv情報

著者 Yimian Dai,Mengxuan Xiao,Yiming Zhu,Huan Wang,Kehua Guo,Jian Yang
発行日 2024-07-29 15:03:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク