SARATR-X: A Foundation Model for Synthetic Aperture Radar Images Target Recognition

要約

地球観測のための情報を積極的に取得するためには、合成開口レーダー(SAR)が不可欠です。
SAR 自動ターゲット認識 (ATR) は、さまざまな画像条件下でさまざまなターゲット カテゴリを検出して分類することに重点を置いています。
現在の深層学習ベースの SAR ATR メソッドは、通常、特定のデータセットとアプリケーション向けに設計されています。
ATR データセットにわたるさまざまなターゲットの特性、シーンの背景情報、センサー パラメーターが、これらの手法の一般化に課題をもたらしています。
この論文は、自己教師あり学習 (SSL) を使用した基礎モデルに基づいて一般的な SAR ATR を実現することを目的としています。
私たちの動機は、特定のデータセットと条件の制限を打ち破り、ターゲット、シーン、センサー全体にわたる普遍的な知覚能力を取得することです。
SARATR-X という名前の基礎モデルは、事前トレーニング データセット、モデル バックボーン、SSL、評価タスクの 4 つの側面から提案されています。
まず、さまざまな対象カテゴリや撮影条件を備えた14個のデータセットを事前学習データセットとして統合しました。
次に、リモート センシング画像に最適なアプローチを見つけるために、さまざまなモデル バックボーンについて議論しました。
3 番目に、2 段階のトレーニングと SAR 勾配機能を適用して、SARATR-X の多様性と拡張性を確保しました。
最後に、SARATR-X は、8 つのタスク設定を備えた 5 つのデータセットで競争力のある優れたパフォーマンスを達成しました。これは、基礎モデルがユニバーサル SAR ATR を達成できることを示しています。
私たちは、ビッグデータが増大する時代において、SAR 画像解釈の基本モデルを採用する時期が来たと考えています。

要約(オリジナル)

Synthetic aperture radar (SAR) is essential in actively acquiring information for Earth observation. SAR Automatic Target Recognition (ATR) focuses on detecting and classifying various target categories under different image conditions. The current deep learning-based SAR ATR methods are typically designed for specific datasets and applications. Various target characteristics, scene background information, and sensor parameters across ATR datasets challenge the generalization of those methods. This paper aims to achieve general SAR ATR based on a foundation model with Self-Supervised Learning (SSL). Our motivation is to break through the specific dataset and condition limitations and obtain universal perceptual capabilities across the target, scene, and sensor. A foundation model named SARATR-X is proposed with the following four aspects: pre-training dataset, model backbone, SSL, and evaluation task. First, we integrated 14 datasets with various target categories and imaging conditions as a pre-training dataset. Second, different model backbones were discussed to find the most suitable approaches for remote-sensing images. Third, we applied two-stage training and SAR gradient features to ensure the diversity and scalability of SARATR-X. Finally, SARATR-X has achieved competitive and superior performance on 5 datasets with 8 task settings, which shows that the foundation model can achieve universal SAR ATR. We believe it is time to embrace fundamental models for SAR image interpretation in the era of increasing big data.

arxiv情報

著者 Weijie L,Wei Yang,Yuenan Hou,Li Liu,Yongxiang Liu,Xiang Li
発行日 2024-05-15 14:17:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク