Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image Denoising


画像のノイズ除去は、コンピュータ ビジョンの分野における基本的かつ困難なタスクです。
ほとんどの教師ありノイズ除去手法は、ノイズの多い入力からきれいな画像を再構築することを学習しますが、入力には固有のスペクトル バイアスがあり、過度に平滑化されたぼやけた画像が生成される傾向があります。
ノイズ除去タスクにおける視覚的な魅力と高周波ディテールの忠実性の間のトレードオフに対処するために、再構築および生成拡散モデル (RnG) と呼ばれる新しいアプローチを提案します。
さらに、RnG の再構成モジュールと生成モジュール間の効果的な連携を確保するために、2 段階のトレーニング スキームを導入します。
拡散モデルによってもたらされる望ましくないテクスチャを軽減するために、拡散モデルによって適用される逆ステップの数を調整する適応ステップ コントローラーも提案します。これにより、各パッチに追加される高周波ディテールのレベルを制御できるようになり、推論を保存できるようになります。
私たちが提案する RnG を通じて、知覚と歪みの間のより良いバランスを実現します。


Image denoising is a fundamental and challenging task in the field of computer vision. Most supervised denoising methods learn to reconstruct clean images from noisy inputs, which have intrinsic spectral bias and tend to produce over-smoothed and blurry images. Recently, researchers have explored diffusion models to generate high-frequency details in image restoration tasks, but these models do not guarantee that the generated texture aligns with real images, leading to undesirable artifacts. To address the trade-off between visual appeal and fidelity of high-frequency details in denoising tasks, we propose a novel approach called the Reconstruct-and-Generate Diffusion Model (RnG). Our method leverages a reconstructive denoising network to recover the majority of the underlying clean signal, which serves as the initial estimation for subsequent steps to maintain fidelity. Additionally, it employs a diffusion algorithm to generate residual high-frequency details, thereby enhancing visual quality. We further introduce a two-stage training scheme to ensure effective collaboration between the reconstructive and generative modules of RnG. To reduce undesirable texture introduced by the diffusion model, we also propose an adaptive step controller that regulates the number of inverse steps applied by the diffusion model, allowing control over the level of high-frequency details added to each patch as well as saving the inference computational cost. Through our proposed RnG, we achieve a better balance between perception and distortion. We conducted extensive experiments on both synthetic and real denoising datasets, validating the superiority of the proposed approach.


著者 Yujin Wang,Lingen Li,Tianfan Xue,Jinwei Gu
発行日 2023-09-19 16:01:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク