要約
フローベースの手法は、正規化フローを使用して高解像度 (HR) 画像の分布を学習することで、超解像度 (SR) の不適切な性質に対処する有望な結果を実証しています。
ただし、これらのメソッドは事前定義された固定スケール SR しか実行できないため、実際のアプリケーションでの可能性は限られています。
一方、任意スケールSRは注目を集め、大きな進歩を遂げています。
それにもかかわらず、以前の任意スケール SR 手法では、不適切な設定の問題が無視され、ピクセルごとの L1 損失を使用してモデルがトレーニングされるため、SR 出力が不鮮明になります。
この研究では、上記の問題に対する統一的な解決策として「ローカル暗黙的正規化フロー」(LINF) を提案します。
LINF は、正規化されたフローを使用して、さまざまなスケーリング係数の下でテクスチャの詳細の分布をモデル化します。
したがって、LINF は、任意のスケール係数で豊富なテクスチャ詳細を備えた写真のようにリアルな HR 画像を生成できます。
我々は広範な実験でLINFを評価し、LINFが従来の任意スケールのSR手法と比較して最先端の知覚品質を達成していることを示した。
要約(オリジナル)
Flow-based methods have demonstrated promising results in addressing the ill-posed nature of super-resolution (SR) by learning the distribution of high-resolution (HR) images with the normalizing flow. However, these methods can only perform a predefined fixed-scale SR, limiting their potential in real-world applications. Meanwhile, arbitrary-scale SR has gained more attention and achieved great progress. Nonetheless, previous arbitrary-scale SR methods ignore the ill-posed problem and train the model with per-pixel L1 loss, leading to blurry SR outputs. In this work, we propose ‘Local Implicit Normalizing Flow’ (LINF) as a unified solution to the above problems. LINF models the distribution of texture details under different scaling factors with normalizing flow. Thus, LINF can generate photo-realistic HR images with rich texture details in arbitrary scale factors. We evaluate LINF with extensive experiments and show that LINF achieves the state-of-the-art perceptual quality compared with prior arbitrary-scale SR methods.
arxiv情報
著者 | Jie-En Yao,Li-Yuan Tsao,Yi-Chen Lo,Roy Tseng,Chia-Che Chang,Chun-Yi Lee |
発行日 | 2023-07-13 06:27:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google