SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised Learning for Robust Infrared Small Target Detection

要約

シングルフレーム赤外線小型ターゲット (SIRST) 検出は、乱雑な背景から小さいターゲットを認識することを目的としています。
最近、畳み込みニューラル ネットワークは、一般的な物体検出において大きな利点を達成しました。
Transformer の発展に伴い、SIRST モデルの規模は拡大し続けています。
トレーニング サンプルが限られているため、それに応じてパフォーマンスは向上していません。
小さなターゲットの検出には、赤外線データセットの質、量、多様性が重要です。
この問題を強調するために、この論文ではネガティブサンプル拡張法を提案します。
具体的には、自己教師あり学習用に大規模なネガを生成するためのネガティブ拡張アプローチが提案されています。
まず、逐次ノイズモデリング技術を実行してリアルな赤外線データを生成します。
次に、抽出したノイズを元のデータと融合して、生成されたデータの多様性と忠実性を高めます。
最後に、多様性を豊かにし、意味の不変性を維持するためのネガティブ拡張戦略を提案しました。
提案されたアルゴリズムは、大量の擬似データと対応するラベルを含む合成 SIRST-5K データセットを生成します。
赤外線の小さなターゲット データの豊富な多様性により、私たちのアルゴリズムはモデルのパフォーマンスと収束速度を大幅に向上させます。
他の最先端 (SOTA) 手法と比較して、私たちの手法は検出確率 (Pd)、誤報率 (Fa)、および交差オーバーユニオン (IoU) の点で優れたパフォーマンスを達成します。

要約(オリジナル)

Single-frame infrared small target (SIRST) detection aims to recognize small targets from clutter backgrounds. Recently, convolutional neural networks have achieved significant advantages in general object detection. With the development of Transformer, the scale of SIRST models is constantly increasing. Due to the limited training samples, performance has not been improved accordingly. The quality, quantity, and diversity of the infrared dataset are critical to the detection of small targets. To highlight this issue, we propose a negative sample augmentation method in this paper. Specifically, a negative augmentation approach is proposed to generate massive negatives for self-supervised learning. Firstly, we perform a sequential noise modeling technology to generate realistic infrared data. Secondly, we fuse the extracted noise with the original data to facilitate diversity and fidelity in the generated data. Lastly, we proposed a negative augmentation strategy to enrich diversity as well as maintain semantic invariance. The proposed algorithm produces a synthetic SIRST-5K dataset, which contains massive pseudo-data and corresponding labels. With a rich diversity of infrared small target data, our algorithm significantly improves the model performance and convergence speed. Compared with other state-of-the-art (SOTA) methods, our method achieves outstanding performance in terms of probability of detection (Pd), false-alarm rate (Fa), and intersection over union (IoU).

arxiv情報

著者 Yahao Lu,Yupei Lin,Han Wu,Xiaoyu Xian,Yukai Shi,Liang Lin
発行日 2024-03-08 16:14:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク