MPANet: Multi-Patch Attention For Infrared Small Target object Detection

要約

赤外線スモールターゲット検出(ISTD)は広く注目され、さまざまな分野で応用されています。
赤外線ターゲットのサイズが小さく、複雑な背景からのノイズ干渉があるため、畳み込みニューラルネットワーク(CNN)を使用したISTDのパフォーマンスは制限されます。
さらに、長距離に依存する特徴をバニラCNNでエンコードできないという制約も、複雑なシナリオでターゲットの形状と位置をキャプチャする堅牢性を損ないます。
この目的のために、アキシャルアテンションエンコーダとマルチスケールパッチブランチ(MSPB)構造に基づくマルチパッチアテンションネットワーク(MPANet)が提案されています。
特に、軸方向の注意が改善されたエンコーダアーキテクチャは、小さなターゲットの効果的な機能を強調し、バックグラウンドノイズを抑制するように設計されています。
さらに、開発されたMSPB構造は、さまざまなセマンティックスケールからの粗粒度と細粒度の機能を融合します。
SIRSTデータセットに関する広範な実験は、最先端の方法と比較して、提案されたMPANetの優れたパフォーマンスと有効性を示しています。

要約(オリジナル)

Infrared small target detection (ISTD) has attracted widespread attention and been applied in various fields. Due to the small size of infrared targets and the noise interference from complex backgrounds, the performance of ISTD using convolutional neural networks (CNNs) is restricted. Moreover, the constriant that long-distance dependent features can not be encoded by the vanilla CNNs also impairs the robustness of capturing targets’ shapes and locations in complex scenarios. To this end, a multi-patch attention network (MPANet) based on the axial-attention encoder and the multi-scale patch branch (MSPB) structure is proposed. Specially, an axial-attention-improved encoder architecture is designed to highlight the effective features of small targets and suppress background noises. Furthermore, the developed MSPB structure fuses the coarse-grained and fine-grained features from different semantic scales. Extensive experiments on the SIRST dataset show the superiority performance and effectiveness of the proposed MPANet compared to the state-of-the-art methods.

arxiv情報

著者 Ao Wang,Wei Li,Xin Wu,Zhanchao Huang,Ran Tao
発行日 2022-06-05 08:01:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク