Dense Nested Attention Network for Infrared Small Target Detection

要約

単一フレーム赤外線小型ターゲット (SIRST) 検出は、小さなターゲットを乱雑な背景から分離することを目的としています。
ディープ ラーニングの進歩により、CNN ベースの方法は、その強力なモデリング機能により、一般的なオブジェクトの検出において有望な結果をもたらしました。
ただし、既存の CNN ベースの方法を赤外線の小さなターゲットに直接適用することはできません。これは、ネットワーク内の層をプールすると、深い層のターゲットが失われる可能性があるためです。
この問題を処理するために、この論文では密にネストされた注意ネットワーク (DNANet) を提案します。
具体的には、高密度のネストされた対話型モジュール (DNIM) を設計して、高レベルおよび低レベルの機能間の漸進的な相互作用を実現します。
DNIMで繰り返される相互作用により、深層の赤外線の小さなターゲットを維持できます。
DNIMに基づいて、マルチレベル機能を適応的に強化するために、カスケードチャネルおよび空間注意モジュール(CSAM)をさらに提案します。
当社の DNANet を使用すると、小さなターゲットのコンテキスト情報をうまく組み込み、融合と強化を繰り返すことで十分に活用できます。
さらに、赤外線の小さなターゲット データセット (NUDT-SIRST) を開発し、総合的な性能評価を行うための一連の評価指標を提案します。
公開データセットと私たちが開発したデータセットの両方での実験は、私たちの方法の有効性を示しています。
他の最先端の方法と比較して、私たちの方法は、検出確率 (Pd)、誤警報率 (Fa)、および和集合 (IoU) の点で優れたパフォーマンスを達成します。

要約(オリジナル)

Single-frame infrared small target (SIRST) detection aims at separating small targets from clutter backgrounds. With the advances of deep learning, CNN-based methods have yielded promising results in generic object detection due to their powerful modeling capability. However, existing CNN-based methods cannot be directly applied for infrared small targets since pooling layers in their networks could lead to the loss of targets in deep layers. To handle this problem, we propose a dense nested attention network (DNANet) in this paper. Specifically, we design a dense nested interactive module (DNIM) to achieve progressive interaction among high-level and low-level features. With the repeated interaction in DNIM, infrared small targets in deep layers can be maintained. Based on DNIM, we further propose a cascaded channel and spatial attention module (CSAM) to adaptively enhance multi-level features. With our DNANet, contextual information of small targets can be well incorporated and fully exploited by repeated fusion and enhancement. Moreover, we develop an infrared small target dataset (namely, NUDT-SIRST) and propose a set of evaluation metrics to conduct comprehensive performance evaluation. Experiments on both public and our self-developed datasets demonstrate the effectiveness of our method. Compared to other state-of-the-art methods, our method achieves better performance in terms of probability of detection (Pd), false-alarm rate (Fa), and intersection of union (IoU).

arxiv情報

著者 Boyang Li,Chao Xiao,Longguang Wang,Yingqian Wang,Zaiping Lin,Miao Li,Wei An,Yulan Guo
発行日 2022-08-16 02:45:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク