Diverse super-resolution with pretrained deep hiererarchical VAEs


この研究では、事前トレーニングされた階層変分オートエンコーダー (HVAE) を事前学習として使用することを提案します。
軽量の確率的エンコーダーをトレーニングして、事前トレーニングされた HVAE の潜在空間で低解像度画像をエンコードします。


We investigate the problem of producing diverse solutions to an image super-resolution problem. From a probabilistic perspective, this can be done by sampling from the posterior distribution of an inverse problem, which requires the definition of a prior distribution on the high-resolution images. In this work, we propose to use a pretrained hierarchical variational autoencoder (HVAE) as a prior. We train a lightweight stochastic encoder to encode low-resolution images in the latent space of a pretrained HVAE. At inference, we combine the low-resolution encoder and the pretrained generative model to super-resolve an image. We demonstrate on the task of face super-resolution that our method provides an advantageous trade-off between the computational efficiency of conditional normalizing flows techniques and the sample quality of diffusion based methods.


著者 Jean Prost,Antoine Houdard,Andrés Almansa,Nicolas Papadakis
発行日 2024-01-09 14:27:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク