Diffusion Models, Image Super-Resolution And Everything: A Survey

要約

拡散モデル (DM) は、画像の超解像度 (SR) 分野を破壊し、画質と人間の知覚の好みとの間のギャップをさらに縮めました。
これらはトレーニングが簡単で、以前の生成方法で生成されたサンプルのリアリズムを超える非常に高品質のサンプルを生成できます。
有望な結果にもかかわらず、高い計算要求、比較可能性、説明可能性の欠如、色の変化など、さらなる研究が必要な新たな課題も伴います。
残念なことに、出版物が豊富にあるため、この分野への参入は圧倒的に困難です。
これに対処するために、画像 SR に適用される DM の基礎となる理論的基礎を統一的に再集計し、この分野における広範な既存のレビューとは異なる、この領域内の独自の特性と方法論を強調する詳細な分析を提供します。
この調査は、DM 原則の一貫した理解を明確にし、代替入力ドメイン、条件付け技術、誘導メカニズム、破損空間、ゼロショット学習アプローチなどの現在の研究手段を調査します。
この調査は、DM のレンズを通して画像 SR の進化と現在の傾向を詳細に調査することで、既存の課題に光を当て、潜在的な将来の方向性を示し、この急速に進歩する分野でさらなる革新を促すことを目的としています。

要約(オリジナル)

Diffusion Models (DMs) have disrupted the image Super-Resolution (SR) field and further closed the gap between image quality and human perceptual preferences. They are easy to train and can produce very high-quality samples that exceed the realism of those produced by previous generative methods. Despite their promising results, they also come with new challenges that need further research: high computational demands, comparability, lack of explainability, color shifts, and more. Unfortunately, entry into this field is overwhelming because of the abundance of publications. To address this, we provide a unified recount of the theoretical foundations underlying DMs applied to image SR and offer a detailed analysis that underscores the unique characteristics and methodologies within this domain, distinct from broader existing reviews in the field. This survey articulates a cohesive understanding of DM principles and explores current research avenues, including alternative input domains, conditioning techniques, guidance mechanisms, corruption spaces, and zero-shot learning approaches. By offering a detailed examination of the evolution and current trends in image SR through the lens of DMs, this survey sheds light on the existing challenges and charts potential future directions, aiming to inspire further innovation in this rapidly advancing area.

arxiv情報

著者 Brian B. Moser,Arundhati S. Shanbhag,Federico Raue,Stanislav Frolov,Sebastian Palacio,Andreas Dengel
発行日 2024-02-06 12:20:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM パーマリンク