GCD-DDPM: A Generative Change Detection Model Based on Difference-Feature Guided DDPM

要約

ディープラーニング(DL)に基づく手法は、最近、ビット時間変化検出(CD)において大きな可能性を示している。畳み込みニューラルネットワーク(CNN)やトランスフォーマーに基づく既存の識別手法は、変化認識のための識別的表現学習に依存する一方で、局所的および長距離的な文脈依存性の探索に苦慮している。その結果、多様な地上シーンにおいて、きめ細かく頑健なCDマップを得ることは依然として困難である。この課題に対処するため、本研究では、GCD-DDPMと呼ばれる生成的変化検出モデルを提案し、各画素を変化した、あるいは変化していないカテゴリに分類する代わりに、ノイズ除去拡散確率モデル(DDPM)を利用することで、CDマップを直接生成する。さらに、差分条件エンコーダ(DCE)は、多階層の差分特徴を利用してCDマップの生成をガイドするように設計されている。変分推論(VI)手順を活用することで、GCD-DDPMは反復推論プロセスを通じて適応的にCD結果を再較正し、同時に多様なシーンにおける微妙で不規則な変化を正確に区別することができる。最後に、ノイズ抑制に基づくセマンティック・エンハンサー(NSSE)は、CDエンコーダーからの現在のステップの変化認識特徴表現におけるノイズを軽減するために特別に設計されている。この改良はアテンションマップとして機能し、CDの精度を向上させながら、後続の反復をガイドすることができる。4つの高解像度CDデータセットを用いた広範な実験により、提案するGCD-DDPMの優れた性能が確認された。この研究のコードはhttps://github.com/udrs/GCD。

要約(オリジナル)

Deep learning (DL)-based methods have recently shown great promise in bitemporal change detection (CD). Existing discriminative methods based on Convolutional Neural Networks (CNNs) and Transformers rely on discriminative representation learning for change recognition while struggling with exploring local and long-range contextual dependencies. As a result, it is still challenging to obtain fine-grained and robust CD maps in diverse ground scenes. To cope with this challenge, this work proposes a generative change detection model called GCD-DDPM to directly generate CD maps by exploiting the Denoising Diffusion Probabilistic Model (DDPM), instead of classifying each pixel into changed or unchanged categories. Furthermore, the Difference Conditional Encoder (DCE), is designed to guide the generation of CD maps by exploiting multi-level difference features. Leveraging the variational inference (VI) procedure, GCD-DDPM can adaptively re-calibrate the CD results through an iterative inference process, while accurately distinguishing subtle and irregular changes in diverse scenes. Finally, a Noise Suppression-based Semantic Enhancer (NSSE) is specifically designed to mitigate noise in the current step’s change-aware feature representations from the CD Encoder. This refinement, serving as an attention map, can guide subsequent iterations while enhancing CD accuracy. Extensive experiments on four high-resolution CD datasets confirm the superior performance of the proposed GCD-DDPM. The code for this work will be available at https://github.com/udrs/GCD.

arxiv情報

著者 Yihan Wen,Xianping Ma,Xiaokang Zhang,Man-On Pun
発行日 2024-03-02 13:37:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク