Content-oriented learned image compression

要約

近年、ディープニューラルネットワークの開発により、エンドツーエンドで最適化された画像圧縮が大幅に進歩し、レート歪み性能の点で従来の方法を上回りました。
ただし、ほとんどの学習ベースの画像圧縮方法にはラベルがなく、モデルを最適化するときに画像のセマンティクスやコンテンツを考慮しません。
実際、人間の目はコンテンツごとに感度が異なるため、画像コンテンツも考慮する必要があります。
本論文では、異なる戦略で異なる種類の画像コンテンツを処理するコンテンツ指向の画像圧縮方法を提案する。
広範な実験は、提案された方法が、最先端のエンドツーエンドの学習された画像圧縮方法または古典的な方法と比較して、競争力のある主観的な結果を達成することを示している。

要約(オリジナル)

In recent years, with the development of deep neural networks, end-to-end optimized image compression has made significant progress and exceeded the classic methods in terms of rate-distortion performance. However, most learning-based image compression methods are unlabeled and do not consider image semantics or content when optimizing the model. In fact, human eyes have different sensitivities to different content, so the image content also needs to be considered. In this paper, we propose a content-oriented image compression method, which handles different kinds of image contents with different strategies. Extensive experiments show that the proposed method achieves competitive subjective results compared with state-of-the-art end-to-end learned image compression methods or classic methods.

arxiv情報

著者 Meng Li,Shangyin Gao,Yihui Feng,Yibo Shi,Jing Wang
発行日 2022-07-28 15:29:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM, eess.IV パーマリンク