Dynamic Background Reconstruction via Transformer for Infrared Small Target Detection

要約

複雑な背景の下での赤外線小型ターゲット検出 (ISTD) は、ターゲットと背景の違いを区別するのが容易ではないため、難しい問題です。
背景再構成は、この問題に対処する方法の 1 つです。
この論文では、Dynamic Background Reconstruction (DBR) と呼ばれる背景再構成に基づく ISTD 法を提案します。
DBR は、動的シフト ウィンドウ モジュール (DSW)、背景再構成モジュール (BR)、および検出ヘッド (DH) の 3 つのモジュールで構成されます。
BR は、失われたパッチを再構築する際にビジョン トランスフォーマーを利用し、50\% のマスキング率のグリッド マスキング戦略を採用して、ターゲットのないきれいな背景を再構築します。
1 つのターゲットが隣接する 2 つのパッチに分割されて再構築が失敗することを避けるために、DSW は入力埋め込みの前に実行されます。
DSW はオフセットを計算し、それに応じて赤外線画像が動的にシフトします。
再構成エラーをターゲットと見なして発生する False Positive (FP) ケースを減らすために、DH は密に接続された Transformer の構造を利用して、検出性能をさらに向上させます。
実験結果は、DBR が 2 つの ISTD データセット、MFIRST (64.10\%) および SIRST (75.01\%) で最高の F1 スコアを達成することを示しています。

要約(オリジナル)

Infrared small target detection (ISTD) under complex backgrounds is a difficult problem, for the differences between targets and backgrounds are not easy to distinguish. Background reconstruction is one of the methods to deal with this problem. This paper proposes an ISTD method based on background reconstruction called Dynamic Background Reconstruction (DBR). DBR consists of three modules: a dynamic shift window module (DSW), a background reconstruction module (BR), and a detection head (DH). BR takes advantage of Vision Transformers in reconstructing missing patches and adopts a grid masking strategy with a masking ratio of 50\% to reconstruct clean backgrounds without targets. To avoid dividing one target into two neighboring patches, resulting in reconstructing failure, DSW is performed before input embedding. DSW calculates offsets, according to which infrared images dynamically shift. To reduce False Positive (FP) cases caused by regarding reconstruction errors as targets, DH utilizes a structure of densely connected Transformer to further improve the detection performance. Experimental results show that DBR achieves the best F1-score on the two ISTD datasets, MFIRST (64.10\%) and SIRST (75.01\%).

arxiv情報

著者 Jingchao Peng,Haitao Zhao,Zhengwei Hu,Kaijie Zhao,Zhongze Wang
発行日 2023-01-11 14:45:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク