Compressing Sign Information in DCT-based Image Coding via Deep Sign Retrieval

要約

離散コサイン変換 (DCT) 係数の符号情報の圧縮は、符号の確率が等しい特性のため、画像符号化方式では扱いにくい問題です。
この困難を克服するために、我々は「標識検索」と呼ばれる標識情報の効率的な圧縮方法を提案する。
この方法は、離散フーリエ変換係数の大きさから位相情報を求める古典的な信号復元問題である位相回復からインスピレーションを得ています。
すべての DCT 係数の符号情報は、エンコーダでビットストリームから除外され、デコーダで符号検索方法によって補完されます。
実験を通じて、符号のビット量と計算コストの点で、私たちの方法が以前の方法よりも優れていることを示します。
Python 言語で実装された私たちのメソッドは、https://github.com/ctsutake/dsr から入手できます。

要約(オリジナル)

Compressing the sign information of discrete cosine transform (DCT) coefficients is an intractable problem in image coding schemes due to the equiprobable characteristics of the signs. To overcome this difficulty, we propose an efficient compression method for the sign information called ‘sign retrieval.’ This method is inspired by phase retrieval, which is a classical signal restoration problem of finding the phase information of discrete Fourier transform coefficients from their magnitudes. The sign information of all DCT coefficients is excluded from a bitstream at the encoder and is complemented at the decoder through our sign retrieval method. We show through experiments that our method outperforms previous ones in terms of the bit amount for the signs and computation cost. Our method, implemented in Python language, is available from https://github.com/ctsutake/dsr.

arxiv情報

著者 Kei Suzuki,Chihiro Tsutake,Keita Takahashi,Toshiaki Fujii
発行日 2024-05-10 11:19:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, eess.IV, eess.SP, math.IT パーマリンク