Convolutional Neural Network (CNN) to reduce construction loss in JPEG compression caused by Discrete Fourier Transform (DFT)

要約

ここ数十年、デジタル画像処理は大きな人気を博している。その結果、画像を表現するのに必要な情報量を最小限に抑えることを目標に、数多くのデータ圧縮戦略が打ち出されてきた。その中でもJPEG圧縮は、マルチメディアやデジタルアプリケーションに広く適用されている最も一般的な手法の1つである。DFTの周期的な性質により、画像の対向するエッジの周期的な条件を、深刻なアーティファクトを発生させることなく満たすことは不可能であり、画像の知覚的な視覚品質を低下させる。一方、ディープラーニングは近年、音声認識、画像縮小、自然言語処理などの用途で優れた成果を上げている。畳み込みニューラルネットワーク(CNN)は、他のほとんどのタイプのディープニューラルネットワークよりも注目されている。特徴抽出に畳み込みを用いることで、冗長な特徴マップが少なくなり、データセットが小さくなる。本研究では、オートエンコーダを用いた効果的な画像圧縮方法を提案する。研究の結果、オートエンコーダを用いることで、良好な圧縮とともに、より優れた再構成が達成できることを示唆する多くの重要な傾向が明らかになった。

要約(オリジナル)

In recent decades, digital image processing has gained enormous popularity. Consequently, a number of data compression strategies have been put forth, with the goal of minimizing the amount of information required to represent images. Among them, JPEG compression is one of the most popular methods that has been widely applied in multimedia and digital applications. The periodic nature of DFT makes it impossible to meet the periodic condition of an image’s opposing edges without producing severe artifacts, which lowers the image’s perceptual visual quality. On the other hand, deep learning has recently achieved outstanding results for applications like speech recognition, image reduction, and natural language processing. Convolutional Neural Networks (CNN) have received more attention than most other types of deep neural networks. The use of convolution in feature extraction results in a less redundant feature map and a smaller dataset, both of which are crucial for image compression. In this work, an effective image compression method is purposed using autoencoders. The study’s findings revealed a number of important trends that suggested better reconstruction along with good compression can be achieved using autoencoders.

arxiv情報

著者 Suman Kunwar
発行日 2023-07-02 23:41:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク