Universal Learned Image Compression With Low Computational Cost

要約

最近、学習した画像圧縮方法が急速に発展し、JPEG、JPEG2000、BPGなどの従来の標準と比較して優れたレート歪み性能を示しました。
ただし、学習ベースの方法は計算コストが高く、リソースが限られているデバイスへの展開には役立ちません。
この目的のために、エネルギー消費を大幅に削減するために、エンコーダー用のSAPM-Eとデコーダー用のSAPM-Dを含むシフト加算並列モジュール(SAPM)を提案します。
具体的には、既存のCNNベースのアーキテクチャをアップグレードするためのプラグアンドプレイコンポーネントと見なすことができます。ここでは、シフトブランチを使用して、追加ブランチによって学習された小粒度の機能と比較して大粒度の機能を抽出します。
さらに、潜在表現の確率分布を徹底的に分析し、より正確なエントロピー推定のためにラプラス混合尤度を使用することを提案します。
実験結果は、提案された方法が、PSNRとMS-SSIMの両方のメトリックで、約2倍のエネルギー削減で畳み込みの対応するものと同等またはそれ以上のパフォーマンスを達成できることを示しています。

要約(オリジナル)

Recently, learned image compression methods have developed rapidly and exhibited excellent rate-distortion performance when compared to traditional standards, such as JPEG, JPEG2000 and BPG. However, the learning-based methods suffer from high computational costs, which is not beneficial for deployment on devices with limited resources. To this end, we propose shift-addition parallel modules (SAPMs), including SAPM-E for the encoder and SAPM-D for the decoder, to largely reduce the energy consumption. To be specific, they can be taken as plug-and-play components to upgrade existing CNN-based architectures, where the shift branch is used to extract large-grained features as compared to small-grained features learned by the addition branch. Furthermore, we thoroughly analyze the probability distribution of latent representations and propose to use Laplace Mixture Likelihoods for more accurate entropy estimation. Experimental results demonstrate that the proposed methods can achieve comparable or even better performance on both PSNR and MS-SSIM metrics to that of the convolutional counterpart with an about 2x energy reduction.

arxiv情報

著者 Bowen Li,Yao Xin,Youneng Bao,Fanyang Meng,Yongsheng Liang,Wen Tan
発行日 2022-06-23 10:23:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク