The Rate-Distortion-Perception-Classification Tradeoff: Joint Source Coding and Modulation via Inverse-Domain GANs

要約

ジョイント ソース コーディングと変調 (JSCM) フレームワークは、ディープ ラーニングの最近の開発によって可能になり、データから自動的に学習し、エンドツーエンドの方法で最適な圧縮コードと変調スキームを学習できるようになります。
この論文では、JSCM シナリオにおけるチャネル レート、歪み、知覚、分類精度の間に厳密なトレードオフが存在することを示します。
次に、そのトレードオフを回避するための 2 つの画像圧縮方法を提案します。1 つは、極度の圧縮を実現する逆ドメイン生成敵対的ネットワーク (ID-GAN) で、もう 1 つは、ID-GAN のパフォーマンスに関する洞察を明らかにする、よりシンプルでヒューリスティックな方法です。
実験結果は理論的発見を裏付けるだけでなく、提案された ID-GAN アルゴリズムが従来の分離ベースの方法や最近のディープ JSCM アーキテクチャと比較してシステムのパフォーマンスを大幅に向上させることを実証しています。

要約(オリジナル)

The joint source coding and modulation (JSCM) framework was enabled by recent developments in deep learning, which allows to automatically learn from data, and in an end-to-end fashion, the best compression codes and modulation schemes. In this paper, we show the existence of a strict tradeoff between channel rate, distortion, perception, and classification accuracy in a JSCM scenario. We then propose two image compression methods to navigate that tradeoff: an inverse-domain generative adversarial network (ID-GAN), which achieves extreme compression, and a simpler, heuristic method that reveals insights about the performance of ID-GAN. Experiment results not only corroborate the theoretical findings, but also demonstrate that the proposed ID-GAN algorithm significantly improves system performance compared to traditional separation-based methods and recent deep JSCM architectures.

arxiv情報

著者 Junli Fang,João F. C. Mota,Baoshan Lu,Weicheng Zhang,Xuemin Hong
発行日 2023-12-22 16:06:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, math.IT, math.PR パーマリンク