Deep learning-based Edge-aware pre and post-processing methods for JPEG compressed images

要約

我々は、前処理と後処理のディープ CNN 間の標準コーデックを包含する学習ベースの圧縮スキームを提案します。
具体的には、(a) 従来の研究で一般的に発生していたぼやけを防ぐためのエッジ認識損失関数と、(b) 超解像度畳み込みニューラル ネットワーク (CNN) を導入することにより、圧縮伸張ネットワークを利用した従来のアプローチに対する改善を実証します。
対応する前処理ネットワークとともに後処理を行い、低レート領域でのレート歪み性能を向上させます。
このアルゴリズムは、低解像度から高解像度までさまざまなデータセット、つまり Set 5、Set 7、Classic 5、Set 14、Live 1、Kodak、General 100、CLIC 2019 で評価されます。JPEG、JPEG2000、BPG、および最近のデータセットと比較すると、
CNN アプローチでは、提案されたアルゴリズムは PSNR の大幅な改善に貢献し、低ビットレートと高ビットレートでそれぞれ 20.75%、8.47%、3.22%、3.23%、および 24.59%、14.46%、10.14%、8.57% のおよそのゲインを実現します。
同様に、MS-SSIM におけるこの改善は、低ビットレートおよび高ビットレートでそれぞれ約 71.43%、50%、36.36%、23.08%、64.70%、および 64.47%、61.29%、47.06%、51.52%、16.28% です。
CLIC 2019 データセットでは、PSNR は、JPEG2000、BPG、および最近の CNN アプローチよりも、低ビットレートおよび高ビットレートでそれぞれ約 16.67%、10.53%、6.78%、および 24.62%、17.39%、14.08% 優れていることがわかります。
同様に、MS-SSIM は、同じものと比較して、低ビットレートおよび高ビットレートでそれぞれ約 72%、45.45%、39.13%、18.52%、および 71.43%、50%、41.18%、17.07% 優れていることがわかります。
近づいてきます。
他のデータセットでも同様の改善が達成されます。

要約(オリジナル)

We propose a learning-based compression scheme that envelopes a standard codec between pre and post-processing deep CNNs. Specifically, we demonstrate improvements over prior approaches utilizing a compression-decompression network by introducing: (a) an edge-aware loss function to prevent blurring that is commonly occurred in prior works & (b) a super-resolution convolutional neural network (CNN) for post-processing along with a corresponding pre-processing network for improved rate-distortion performance in the low rate regime. The algorithm is assessed on a variety of datasets varying from low to high resolution namely Set 5, Set 7, Classic 5, Set 14, Live 1, Kodak, General 100, CLIC 2019. When compared to JPEG, JPEG2000, BPG, and recent CNN approach, the proposed algorithm contributes significant improvement in PSNR with an approximate gain of 20.75%, 8.47%, 3.22%, 3.23% and 24.59%, 14.46%, 10.14%, 8.57% at low and high bit-rates respectively. Similarly, this improvement in MS-SSIM is approximately 71.43%, 50%, 36.36%, 23.08%, 64.70% and 64.47%, 61.29%, 47.06%, 51.52%, 16.28% at low and high bit-rates respectively. With CLIC 2019 dataset, PSNR is found to be superior with approximately 16.67%, 10.53%, 6.78%, and 24.62%, 17.39%, 14.08% at low and high bit-rates respectively, over JPEG2000, BPG, and recent CNN approach. Similarly, the MS-SSIM is found to be superior with approximately 72%, 45.45%, 39.13%, 18.52%, and 71.43%, 50%, 41.18%, 17.07% at low and high bit-rates respectively, compared to the same approaches. A similar type of improvement is achieved with other datasets also.

arxiv情報

著者 Dipti Mishra,Satish Kumar Singh,Rajat Kumar Singh
発行日 2023-11-02 15:35:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク