要約
本論文では、変調の観点から学習画像圧縮(LIC)における統一変換手法を提案する。
まず、LIC での量子化は、加法的な均一ノイズを持つ一般化されたチャネルとして考慮されます。
さらに、LIC は、構造の一貫性や最適化の目的に応じて、特定の通信システムとして解釈されます。
したがって、通信システムのテクノロジーを応用して、LIC のモジュール設計をガイドできます。
さらに、信号変調 (TSM) に基づく統一変換方法が定義されています。
TSM の観点では、既存の変換方法は数学的に線形変調に還元されます。
一連の変換メソッド。
TPM と TJM は、非線形変調に拡張することで得られます。
さまざまなデータセットとバックボーン アーキテクチャに関する実験結果により、提案された方法の有効性と堅牢性が検証されています。
さらに重要なのは、コミュニケーションの観点から LIC 設計を導くことの実現可能性をさらに裏付けることです。
たとえば、バックボーン アーキテクチャがコンテキスト モデルを組み合わせたハイパープリアである場合、私たちの方法は、複雑さを増すことなく、Kodak データセット上で GDN と比較して 3.52$\%$ BD レートの削減を達成します。
要約(オリジナル)
In this paper, a unified transformation method in learned image compression(LIC) is proposed from the perspective of modulation. Firstly, the quantization in LIC is considered as a generalized channel with additive uniform noise. Moreover, the LIC is interpreted as a particular communication system according to the consistency in structures and optimization objectives. Thus, the technology of communication systems can be applied to guide the design of modules in LIC. Furthermore, a unified transform method based on signal modulation (TSM) is defined. In the view of TSM, the existing transformation methods are mathematically reduced to a linear modulation. A series of transformation methods, e.g. TPM and TJM, are obtained by extending to nonlinear modulation. The experimental results on various datasets and backbone architectures verify that the effectiveness and robustness of the proposed method. More importantly, it further confirms the feasibility of guiding LIC design from a communication perspective. For example, when backbone architecture is hyperprior combining context model, our method achieves 3.52$\%$ BD-rate reduction over GDN on Kodak dataset without increasing complexity.
arxiv情報
著者 | Youneng Bao,Fangyang Meng,Wen Tan,Chao Li,Yonghong Tian,Yongsheng Liang |
発行日 | 2024-03-12 13:57:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google