要約
我々は、圧縮タスクが輝度とクロミナンスのタスクに分割される、構造と色ベースの学習画像コーデック (SLIC) を提案します。
深層学習モデルは、エンコーダーの Y および UV チャネル用の新しいマルチスケール アーキテクチャを使用して構築されており、さまざまなステージからの特徴が結合されて潜在表現が取得されます。
自己回帰コンテキスト モデルは後方適応に使用され、ハイパープリア ブロックは前方適応に使用されます。
提案されたモデルのパフォーマンスを調査および分析し、他の画像コーデックと比較するために、さまざまな実験が実行されます。
また、チャネルのインパルス応答、潜在チャネル、およびさまざまなアブレーション研究の視覚化を通じて、この方法の利点を説明します。
このモデルは、他の最先端のリファレンス コーデックと比較して、MS-SSIM および CIEDE2000 メトリックに関して 7.5% および 4.66% の Bjntegaard デルタ ビットレート ゲインを達成しています。
要約(オリジナル)
We propose the structure and color based learned image codec (SLIC) in which the task of compression is split into that of luminance and chrominance. The deep learning model is built with a novel multi-scale architecture for Y and UV channels in the encoder, where the features from various stages are combined to obtain the latent representation. An autoregressive context model is employed for backward adaptation and a hyperprior block for forward adaptation. Various experiments are carried out to study and analyze the performance of the proposed model, and to compare it with other image codecs. We also illustrate the advantages of our method through the visualization of channel impulse responses, latent channels and various ablation studies. The model achieves Bj{\o}ntegaard delta bitrate gains of 7.5% and 4.66% in terms of MS-SSIM and CIEDE2000 metrics with respect to other state-of-the-art reference codecs.
arxiv情報
著者 | Srivatsa Prativadibhayankaram,Mahadev Prasad Panda,Thomas Richter,Heiko Sparenberg,Siegfried Fößel,André Kaup |
発行日 | 2024-01-30 18:39:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google