Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation

要約

この研究では、赤外線小型ターゲット ラベル生成 (IRSTLG) のための学習ベースの単一点アノテーション パラダイムを構築する最初の試みを行います。
私たちの直観では、ラベル生成にはターゲット検出よりもポイント プロンプトが 1 つ多く必要であるだけです。IRSTLG は、ターゲット位置のヒントを備えた赤外線小型ターゲット検出 (IRSTD) タスクとみなすことができます。
この洞察に基づいて、ターゲット検出ネットワークを洗練されたラベル生成方法に巧みに変換するエネルギー二重誘導シングルポイント プロンプト (EDGSP) フレームワークを導入します。
具体的には、提案される EDGSP には、1) 擬似ラベルの十分な形状進化のための基礎的なアウトラインを作成するためのターゲット エネルギー初期化 (TEI)、2) 関心のある領域の迅速な位置特定とラベルを回避するための個体差の強化のためのダブル プロンプト埋め込み (DPE) が含まれます。
3) 誤警報を排除する境界ボックスベースのマッチング (BBM)。
実験結果は、EDGSP を備えた 3 つのベースラインによって生成された擬似ラベルが、SIRST、NUDT-SIRST、および IRSTD-1k データセットで 100% の物体レベルの検出確率 (Pd) と 0% の誤警報率 (Fa) を達成することを示しています。
ピクセルレベルの Intersection Over Union (IoU) は、最先端の (SOTA) ラベル生成方法と比較して 13.28% 向上しました。
ダウンストリーム IRSTD の実用化において、EDGSP は初めて、フルラベルを超えた単一点生成疑似マスクを実現します。
粗い単一点アノテーションを使用した場合でも、完全なラベル付けの 99.5% のパフォーマンスを達成します。

要約(オリジナル)

In this work, we make the first attempt to construct a learning-based single-point annotation paradigm for infrared small target label generation (IRSTLG). Our intuition is that label generation requires just one more point prompt than target detection: IRSTLG can be regarded as an infrared small target detection (IRSTD) task with the target location hint. Based on this insight, we introduce an energy double guided single-point prompt (EDGSP) framework, which adeptly transforms the target detection network into a refined label generation method. Specifically, the proposed EDGSP includes: 1) target energy initialization (TEI) to create a foundational outline for sufficient shape evolution of pseudo label, 2) double prompt embedding (DPE) for rapid localization of interested regions and reinforcement of individual differences to avoid label adhesion, and 3) bounding box-based matching (BBM) to eliminate false alarms. Experimental results show that pseudo labels generated by three baselines equipped with EDGSP achieve 100% object-level probability of detection (Pd) and 0% false-alarm rate (Fa) on SIRST, NUDT-SIRST, and IRSTD-1k datasets, with a pixel-level intersection over union (IoU) improvement of 13.28% over state-of-the-art (SOTA) label generation methods. In the practical application of downstream IRSTD, EDGSP realizes, for the first time, a single-point generated pseudo mask beyond the full label. Even with coarse single-point annotations, it still achieves 99.5% performance of full labeling.

arxiv情報

著者 Shuai Yuan,Hanlin Qin,Renke Kou,Xiang Yan,Zechuan Li,Chenxu Peng,Abd-Krim Seghouane
発行日 2024-08-19 01:35:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク