Lossless Image Compression Using Multi-level Dictionaries: Binary Images

要約

可逆画像圧縮は、画像の保存コストや送信コストを削減するためにさまざまなアプリケーションで必要とされていますが、再構成された画像は元の画像と比較して情報損失がゼロである必要があります。
既存の可逆画像圧縮方法は、設計は単純ですが圧縮パフォーマンスが低いか、設計が複雑でパフォーマンスは向上しますが、パフォーマンスの保証はありません。
複雑さが低く、パフォーマンスが保証された可逆画像圧縮方法を開発するという私たちの取り組みの中で、カラー画像の圧縮率は本質的にその空間構造、強度の変化、および色の変化のパターンに由来すると主張します。
したがって、可逆画像圧縮スキームの全体的な設計を、対応する冗長性を活用する 3 つの部分に分割します。
さらに、画像の二値化バージョンはその基本的な空間構造を捉えていると主張します。
私たちの研究のこの最初の部分では、バイナリ画像の可逆圧縮方式を提案します。
提案されたスキームは、まず、バイナリ画像のさまざまなデータセットから $16\times16$、$8\times8$、$4\times4$、および $2\times 2$ の正方形ピクセル パターンの辞書を学習します。
次に、これらの辞書を使用してバイナリ イメージをエンコードします。
これらの辞書には、効率的でスケーラブルなスキームを構築するためにさらに活用されるさまざまな興味深い特性があります。
私たちの予備的な結果は、提案されたスキームが既存の従来型および学習ベースの可逆圧縮アプローチよりも一貫して優れており、一般的な汎用可逆圧縮スキーム (WebP) よりも平均で $1.5\倍、つまり 3 ドル以上優れたパフォーマンスを提供することを示しています。
最先端の学習ベースのスキームよりも 1 倍優れたパフォーマンスを実現し、バイナリ画像圧縮に特化したスキーム (JBIG2) よりも優れたパフォーマンスを実現します。

要約(オリジナル)

Lossless image compression is required in various applications to reduce storage or transmission costs of images, while requiring the reconstructed images to have zero information loss compared to the original. Existing lossless image compression methods either have simple design but poor compression performance, or complex design, better performance, but with no performance guarantees. In our endeavor to develop a lossless image compression method with low complexity and guaranteed performance, we argue that compressibility of a color image is essentially derived from the patterns in its spatial structure, intensity variations, and color variations. Thus, we divide the overall design of a lossless image compression scheme into three parts that exploit corresponding redundancies. We further argue that the binarized version of an image captures its fundamental spatial structure. In this first part of our work, we propose a scheme for lossless compression of binary images. The proposed scheme first learns dictionaries of $16\times16$, $8\times8$, $4\times4$, and $2\times 2$ square pixel patterns from various datasets of binary images. It then uses these dictionaries to encode binary images. These dictionaries have various interesting properties that are further exploited to construct an efficient and scalable scheme. Our preliminary results show that the proposed scheme consistently outperforms existing conventional and learning based lossless compression approaches, and provides, on average, as much as $1.5\times$ better performance than a common general purpose lossless compression scheme (WebP), more than $3\times$ better performance than a state of the art learning based scheme, and better performance than a specialized scheme for binary image compression (JBIG2).

arxiv情報

著者 Samar Agnihotri,Renu Rameshan,Ritwik Ghosal
発行日 2024-09-11 14:34:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT パーマリンク