Neural Video Compression using GANs for Detail Synthesis and Propagation

要約

生成的敵対的ネットワーク(GAN)に基づく最初のニューラルビデオ圧縮方法を紹介します。
私たちのアプローチは、ユーザースタディにおいて、以前のニューラルおよび非ニューラルビデオ圧縮方式を大幅に上回り、ニューラル方式の視覚的品質に新しい最先端を設定します。
この高い視覚品質を得るには、GAN損失が重要であることを示します。
2つのコンポーネントにより、GAN損失が効果的になります。つまり、i)ワープされた前の再構成から抽出された潜在性でジェネレータを調整して詳細を合成し、ii)この詳細を高品質のフローで伝播します。
メソッドを比較するにはユーザー調査が必要であることがわかります。つまり、どの定量的指標でもすべての調査を予測することはできませんでした。
ネットワーク設計の選択肢を詳細に提示し、ユーザー調査でそれらを排除します。

要約(オリジナル)

We present the first neural video compression method based on generative adversarial networks (GANs). Our approach significantly outperforms previous neural and non-neural video compression methods in a user study, setting a new state-of-the-art in visual quality for neural methods. We show that the GAN loss is crucial to obtain this high visual quality. Two components make the GAN loss effective: we i) synthesize detail by conditioning the generator on a latent extracted from the warped previous reconstruction to then ii) propagate this detail with high-quality flow. We find that user studies are required to compare methods, i.e., none of our quantitative metrics were able to predict all studies. We present the network design choices in detail, and ablate them with user studies.

arxiv情報

著者 Fabian Mentzer,Eirikur Agustsson,Johannes Ballé,David Minnen,Nick Johnston,George Toderici
発行日 2022-07-12 16:06:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク