Conditional Brownian Bridge Diffusion Model for VHR SAR to Optical Image Translation

要約

合成開口レーダー (SAR) イメージング技術には、気象条件や時間に関係なくデータを収集できるという独自の利点があります。
ただし、SAR 画像には複雑な後方散乱パターンやスペックル ノイズが見られるため、解釈には専門知識が必要です。
SAR データの解釈を支援するために、SAR 画像を光学的な表現に変換する研究が行われています。
それにもかかわらず、既存の研究は主に低解像度の衛星画像データセットを利用しており、トレーニングの不安定性と忠実度の低さで知られる敵対的生成ネットワーク (GAN) に主に基づいています。
低解像度データの使用と GAN ベースのアプローチのこれらの制限を克服するために、このホワイトペーパーでは、ブラウンニアン ブリッジ拡散モデル (BBDM) に基づく条件付き画像間変換アプローチを紹介します。
私たちは、SAR と 0.5 メートルの超高解像度 (VHR) の光学画像のペアである MSAW データセットに対して包括的な実験を実施しました。
実験結果は、私たちの方法がさまざまな知覚品質指標において条件付き拡散モデル (CDM) と GAN ベースのモデルの両方を上回っていることを示しています。

要約(オリジナル)

Synthetic Aperture Radar (SAR) imaging technology provides the unique advantage of being able to collect data regardless of weather conditions and time. However, SAR images exhibit complex backscatter patterns and speckle noise, which necessitate expertise for interpretation. Research on translating SAR images into optical-like representations has been conducted to aid the interpretation of SAR data. Nevertheless, existing studies have predominantly utilized low-resolution satellite imagery datasets and have largely been based on Generative Adversarial Network (GAN) which are known for their training instability and low fidelity. To overcome these limitations of low-resolution data usage and GAN-based approaches, this paper introduces a conditional image-to-image translation approach based on Brownian Bridge Diffusion Model (BBDM). We conducted comprehensive experiments on the MSAW dataset, a paired SAR and optical images collection of 0.5m Very-High-Resolution (VHR). The experimental results indicate that our method surpasses both the Conditional Diffusion Models (CDMs) and the GAN-based models in diverse perceptual quality metrics.

arxiv情報

著者 Seon-Hoon Kim,Dae-won Chung
発行日 2024-08-20 13:30:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク