RQAT-INR: Improved Implicit Neural Image Compression

要約

画像・映像圧縮のための深層変分オートエンコーダーは、AVC、HEVC、VVCといった数十年来の伝統的なコーデックと比較して、競争力のある、あるいはそれ以上の圧縮率を提供できる可能性があるため、近年、大きな注目を集めている。しかし、複雑さとエネルギー消費のため、これらのアプローチは産業界で実用化されるにはまだ程遠いのが現状です。最近では、暗黙的神経表現(INR)に基づくコーデックが登場し、デコード時の複雑さとエネルギー使用量が従来のアプローチより低くなっています。しかし、その性能は、現時点では最先端の方法と同等ではありません。本研究では、まずINRベースの画像コーデックがVAEベースのアプローチよりも複雑性が低いことを示し、次にINRベースの画像コーデックについていくつかの改良を提案し、ベースラインモデルを大きく上回る性能を達成しました。

要約(オリジナル)

Deep variational autoencoders for image and video compression have gained significant attraction in the recent years, due to their potential to offer competitive or better compression rates compared to the decades long traditional codecs such as AVC, HEVC or VVC. However, because of complexity and energy consumption, these approaches are still far away from practical usage in industry. More recently, implicit neural representation (INR) based codecs have emerged, and have lower complexity and energy usage to classical approaches at decoding. However, their performances are not in par at the moment with state-of-the-art methods. In this research, we first show that INR based image codec has a lower complexity than VAE based approaches, then we propose several improvements for INR-based image codec and outperformed baseline model by a large margin.

arxiv情報

著者 Bharath Bhushan Damodaran,Muhammet Balcilar,Franck Galpin,Pierre Hellier
発行日 2023-03-06 10:59:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク