IncSAR: A Dual Fusion Incremental Learning Framework for SAR Target Recognition

要約

深層学習技術は、静的シナリオで事前定義されたデータセットを使用した合成開口レーダー (SAR) ターゲット認識で大きな成功を収めました。
ただし、現実世界のアプリケーションでは、モデルが以前に取得した知識を忘れることなく新しい情報を段階的に学習することが求められます。
モデルが新しいタスクに適応するときに過去の知識を失うという壊滅的な忘却の課題は、依然として重要な問題です。
この論文では、SAR ターゲット認識における致命的な忘却に対処するために設計された増分学習フレームワークである IncSAR を紹介します。
IncSAR は、ビジョン トランスフォーマー (ViT) とカスタム設計の畳み込みニューラル ネットワーク (CNN) の能力をデュアル ブランチ アーキテクチャで組み合わせ、後期融合戦略によって統合されています。
さらに、計算の複雑さを軽減するための TinyViT の使用を検討し、特徴表現を動的に強化するためのアテンション メカニズムを提案します。
SAR 画像に固有のスペックル ノイズを軽減するために、ロバスト主成分分析 (RPCA) のニューラル ネットワーク近似に基づくノイズ除去モジュールを採用し、SAR 画像の効率的なノイズ低減にシンプルなニューラル ネットワークを活用します。
さらに、ランダム射影層により特徴の線形分離性が向上し、線形判別分析 (LDA) のバリアントにより、抽出されたクラス プロトタイプの相関が解除され、一般化が向上します。
MSTAR、SAR-AIRcraft-1.0、および OpenSARship ベンチマーク データセットに関する広範な実験により、IncSAR が最先端のアプローチを大幅に上回り、平均精度 99.63\% とパフォーマンス低下 0.33\% (89\% に相当) を達成したことが実証されました。
既存の技術と比較して保持力が向上します。
ソース コードは https://github.com/geokarant/IncSAR で入手できます。

要約(オリジナル)

Deep learning techniques have achieved significant success in Synthetic Aperture Radar (SAR) target recognition using predefined datasets in static scenarios. However, real-world applications demand that models incrementally learn new information without forgetting previously acquired knowledge. The challenge of catastrophic forgetting, where models lose past knowledge when adapting to new tasks, remains a critical issue. In this paper, we introduce IncSAR, an incremental learning framework designed to tackle catastrophic forgetting in SAR target recognition. IncSAR combines the power of a Vision Transformer (ViT) and a custom-designed Convolutional Neural Network (CNN) in a dual-branch architecture, integrated via a late-fusion strategy. Additionally, we explore the use of TinyViT to reduce computational complexity and propose an attention mechanism to dynamically enhance feature representation. To mitigate the speckle noise inherent in SAR images, we employ a denoising module based on a neural network approximation of Robust Principal Component Analysis (RPCA), leveraging a simple neural network for efficient noise reduction in SAR imagery. Moreover, a random projection layer improves the linear separability of features, and a variant of Linear Discriminant Analysis (LDA) decorrelates extracted class prototypes for better generalization. Extensive experiments on the MSTAR, SAR-AIRcraft-1.0, and OpenSARShip benchmark datasets demonstrate that IncSAR significantly outperforms state-of-the-art approaches, achieving a 99.63\% average accuracy and a 0.33\% performance drop, representing an 89\% improvement in retention compared to existing techniques. The source code is available at https://github.com/geokarant/IncSAR.

arxiv情報

著者 George Karantaidis,Athanasios Pantsios,Ioannis Kompatsiaris,Symeon Papadopoulos
発行日 2025-01-17 10:01:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク