ProgDTD: Progressive Learned Image Compression with Double-Tail-Drop Training

要約

プログレッシブ圧縮により、画像は低解像度バージョンとして読み込みを開始し、受信するデータが増えるにつれてより鮮明になります。
これにより、ネットワーク接続が遅い場合などのユーザー エクスペリエンスが向上します。
現在、画像圧縮のほとんどのアプローチは、古典的なアプローチと学習されたアプローチの両方で、非プログレッシブになるように設計されています。
この文書では、学習された非プログレッシブ画像圧縮アプローチをプログレッシブ画像圧縮アプローチに変換するトレーニング方法である ProgDTD を紹介します。
ProgDTD の設計は、圧縮モデルのボトルネック内に格納される情報は一般に重要度が異なるという観察に基づいています。
プログレッシブ圧縮モデルを作成するために、ProgDTD はトレーニング ステップを変更して、モデルが優先度順に並べ替えられたボトルネックにデータを保存するように強制します。
ソートされたインデックスの順序でデータを送信することで、段階的な圧縮を実現します。
ProgDTD は、CNN ベースの学習画像圧縮モデル用に設計されており、追加のパラメーターは必要なく、カスタマイズ可能な範囲のプログレッシブ性を備えています。
評価のために、学習された画像圧縮で最も一般的な構造の 1 つであるハイパープリア モデルに ProgDTD を適用します。
私たちの実験結果は、ProgDTD が MS-SSIM と精度の点で、非プログレッシブ モデルや他の最先端のプログレッシブ モデルと同等のパフォーマンスを発揮することを示しています。

要約(オリジナル)

Progressive compression allows images to start loading as low-resolution versions, becoming clearer as more data is received. This increases user experience when, for example, network connections are slow. Today, most approaches for image compression, both classical and learned ones, are designed to be non-progressive. This paper introduces ProgDTD, a training method that transforms learned, non-progressive image compression approaches into progressive ones. The design of ProgDTD is based on the observation that the information stored within the bottleneck of a compression model commonly varies in importance. To create a progressive compression model, ProgDTD modifies the training steps to enforce the model to store the data in the bottleneck sorted by priority. We achieve progressive compression by transmitting the data in order of its sorted index. ProgDTD is designed for CNN-based learned image compression models, does not need additional parameters, and has a customizable range of progressiveness. For evaluation, we apply ProgDTDto the hyperprior model, one of the most common structures in learned image compression. Our experimental results show that ProgDTD performs comparably to its non-progressive counterparts and other state-of-the-art progressive models in terms of MS-SSIM and accuracy.

arxiv情報

著者 Ali Hojjat,Janek Haberer,Olaf Landsiedel
発行日 2024-04-30 15:20:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク