Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention

要約

赤外線による小型ターゲットの検出は、複雑な背景の乱雑さの中で薄暗いターゲットの位置を正確に特定するという固有の課題に直面しています。
従来のアプローチでは、検出精度と誤警報率のバランスを取るのに苦労しています。
このジレンマを打破するために、我々は「Pick of the Bunch」の原則に従うことで、従来のヒット・ミスのトレードオフを超えた高精度を実現するディープネットワークSeRankDetを提案します。
その中核となるのは、最も顕著な応答を保存する非線形 Top-K 選択プロセスを採用し、一定の複雑さを維持しながらターゲット信号の希釈を防ぐ、Selective Rank-Aware Attendance (SeRank) モジュールです。
さらに、U-Net 構造で一般的な静的連結を、SeRankDet に適応機能統合を強化する動的融合戦略である Large Selective Feature Fusion (LSFF) モジュールに置き換え、真のターゲットと誤報を区別する能力を強化します。
ネットワークの識別力は、当社の拡張差分コンボリューション (DDC) モジュールによってさらに洗練されます。このモジュールは、微妙なターゲットの特性を増幅することを目的とした差分コンボリューションと、受容野を拡大する拡張コンボリューションを組み合わせて、ターゲットとバックグラウンドの分離を大幅に改善します。
提案された SeRankDet は、その軽量アーキテクチャにもかかわらず、複数の公開データセットにわたる最先端のパフォーマンスで新しいベンチマークを設定します。
コードは https://github.com/GrokCV/SeRankDet で入手できます。

要約(オリジナル)

Infrared small target detection faces the inherent challenge of precisely localizing dim targets amidst complex background clutter. Traditional approaches struggle to balance detection precision and false alarm rates. To break this dilemma, we propose SeRankDet, a deep network that achieves high accuracy beyond the conventional hit-miss trade-off, by following the “Pick of the Bunch” principle. At its core lies our Selective Rank-Aware Attention (SeRank) module, employing a non-linear Top-K selection process that preserves the most salient responses, preventing target signal dilution while maintaining constant complexity. Furthermore, we replace the static concatenation typical in U-Net structures with our Large Selective Feature Fusion (LSFF) module, a dynamic fusion strategy that empowers SeRankDet with adaptive feature integration, enhancing its ability to discriminate true targets from false alarms. The network’s discernment is further refined by our Dilated Difference Convolution (DDC) module, which merges differential convolution aimed at amplifying subtle target characteristics with dilated convolution to expand the receptive field, thereby substantially improving target-background separation. Despite its lightweight architecture, the proposed SeRankDet sets new benchmarks in state-of-the-art performance across multiple public datasets. The code is available at https://github.com/GrokCV/SeRankDet.

arxiv情報

著者 Yimian Dai,Peiwen Pan,Yulei Qian,Yuxuan Li,Xiang Li,Jian Yang,Huan Wan
発行日 2024-08-07 12:10:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク