Adapting Learned Image Codecs to Screen Content via Adjustable Transformations

要約

学習済み画像コーデック (LIC) の普及が進むにつれて、配布外データに対するコーディング効率の低さが、一部のアプリケーションにとってボトルネックになっています。
下位互換性を損なうことなく、スクリーン コンテンツ (SC) イメージの LIC のパフォーマンスを向上させるために、基礎となるベースライン コーデックの操作フローを変更せずに、パラメーター化された可逆線形変換をコーディング パイプラインに導入することを提案します。
コーディング効率を高め、コーディングアーティファクトからの回復を支援するために、セットアップ内でプレフィルターとポストフィルターとして機能する 2 つのニューラル ネットワークを設計します。
当社のエンドツーエンドでトレーニングされたソリューションは、ベースライン LIC と比較して、SC 圧縮でビットレートを最大 10% 削減し、追加パラメータは 1% のみです。

要約(オリジナル)

As learned image codecs (LICs) become more prevalent, their low coding efficiency for out-of-distribution data becomes a bottleneck for some applications. To improve the performance of LICs for screen content (SC) images without breaking backwards compatibility, we propose to introduce parameterized and invertible linear transformations into the coding pipeline without changing the underlying baseline codec’s operation flow. We design two neural networks to act as prefilters and postfilters in our setup to increase the coding efficiency and help with the recovery from coding artifacts. Our end-to-end trained solution achieves up to 10% bitrate savings on SC compression compared to the baseline LICs while introducing only 1% extra parameters.

arxiv情報

著者 H. Burak Dogaroglu,A. Burakhan Koyuncu,Atanas Boev,Elena Alshina,Eckehard Steinbach
発行日 2024-02-27 14:34:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク