要約
超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制約によって制限されているシナリオにおいて、画質を向上させるために重要である。SRのための既存の拡散モデルは、ノイズ生成のために主にガウスモデルに依存しており、自然なシーンに固有の複雑で変化しやすいテクスチャを扱う場合には、しばしば不足する。これらの欠点に対処するために、我々はベイズ不確定性誘導拡散確率モデル(BUFF)を導入する。BUFFは、高解像度の不確実性マスクを生成するためにベイジアンネットワークを組み込むことによって、その特徴を際立たせている。これらのマスクは拡散プロセスをガイドし、文脈を認識し適応的な方法でノイズ強度を調整することを可能にする。この斬新なアプローチは、超解像画像の忠実度を元の高解像度画像に近づけるだけでなく、複雑なテクスチャーや微細なディテールを特徴とする領域におけるアーチファクトやぼやけを大幅に軽減する。このモデルは、複雑なノイズパターンに対して卓越した頑健性を示し、画像内のテクスチャやエッジの処理において優れた適応性を示す。視覚的な結果に裏付けされた実証的な証拠は、特に困難なシナリオにおけるモデルのロバスト性と、ぼやけなどのSRの一般的な問題への対処の有効性を示しています。DIV2Kデータセットで実施された実験評価では、BUFFはBSD100のSSIMにおいてベースラインと比較して+0.61という顕著な改善を達成し、従来の拡散アプローチを平均+0.20dB PSNRの追加利得で上回った。これらの結果は、SRの拡散プロセスを強化するベイズ手法の可能性を強調するものであり、この分野における将来の進歩に道を開くものです。
要約(オリジナル)
Super-resolution (SR) techniques are critical for enhancing image quality, particularly in scenarios where high-resolution imagery is essential yet limited by hardware constraints. Existing diffusion models for SR have relied predominantly on Gaussian models for noise generation, which often fall short when dealing with the complex and variable texture inherent in natural scenes. To address these deficiencies, we introduce the Bayesian Uncertainty Guided Diffusion Probabilistic Model (BUFF). BUFF distinguishes itself by incorporating a Bayesian network to generate high-resolution uncertainty masks. These masks guide the diffusion process, allowing for the adjustment of noise intensity in a manner that is both context-aware and adaptive. This novel approach not only enhances the fidelity of super-resolved images to their original high-resolution counterparts but also significantly mitigates artifacts and blurring in areas characterized by complex textures and fine details. The model demonstrates exceptional robustness against complex noise patterns and showcases superior adaptability in handling textures and edges within images. Empirical evidence, supported by visual results, illustrates the model’s robustness, especially in challenging scenarios, and its effectiveness in addressing common SR issues such as blurring. Experimental evaluations conducted on the DIV2K dataset reveal that BUFF achieves a notable improvement, with a +0.61 increase compared to baseline in SSIM on BSD100, surpassing traditional diffusion approaches by an average additional +0.20dB PSNR gain. These findings underscore the potential of Bayesian methods in enhancing diffusion processes for SR, paving the way for future advancements in the field.
arxiv情報
著者 | Zihao He,Shengchuan Zhang,Runze Hu,Yunhang Shen,Yan Zhang |
発行日 | 2025-04-04 14:43:45+00:00 |
arxivサイト | arxiv_id(pdf) |