Rate-Distortion-Perception Tradeoff Based on the Conditional-Distribution Perception Measure

要約

大きなブロック長の漸近限界におけるメモリレスソースモデルのレート-歪み-知覚(RDP)のトレードオフを研究します。
私たちの知覚尺度は、ソースの分布と、[1]、[2] で最初に提案された、エンコーダー出力に条件付けられた再構成シーケンスの分布の間の発散に基づいています。
エンコーダとデコーダの間に共有ランダム性がない場合を考えます。
離散記憶のないソースの場合、RDP 関数の一文字の特徴付けを導き出し、Blau と Michaeli [3] で導入された限界計量 (共有ランダム性なし) に関して未解決のままの問題を解決します。
私たちの達成可能性スキームは、[4] で提案されている事後参照マップを使用した非可逆ソースコーディングに基づいています。
二乗誤差歪み測定および二乗二次ワッサースタイン知覚測定の下での連続値ソースの場合、単一文字の特性評価も導き出し、デコーダでのノイズ追加メカニズムが最適な表現を達成するのに十分であることを示します。
知覚損失がゼロの場合、我々の特徴付けが [5]、[6] で導出された限界指標の結果と興味深いことに一致することを示し、再度、知覚損失ゼロが $3$-dB ペナルティで達成できることを示します。
最小限の歪み。
最後に、結果をガウス源の場合に特化します。
ベクトル ガウス ソースの RDP 関数を導出し、ウォーターフィリング タイプのソリューションを提案します。
また、ベクトル ガウスの混合に対する RDP 関数の部分的な特徴付けも行います。

要約(オリジナル)

We study the rate-distortion-perception (RDP) tradeoff for a memoryless source model in the asymptotic limit of large block-lengths. Our perception measure is based on a divergence between the distributions of the source and reconstruction sequences conditioned on the encoder output, which was first proposed in [1], [2]. We consider the case when there is no shared randomness between the encoder and the decoder. For the case of discrete memoryless sources we derive a single-letter characterization of the RDP function, thus settling a problem that remains open for the marginal metric introduced in Blau and Michaeli [3] (with no shared randomness). Our achievability scheme is based on lossy source coding with a posterior reference map proposed in [4]. For the case of continuous valued sources under squared error distortion measure and squared quadratic Wasserstein perception measure we also derive a single-letter characterization and show that a noise-adding mechanism at the decoder suffices to achieve the optimal representation. For the case of zero perception loss, we show that our characterization interestingly coincides with the results for the marginal metric derived in [5], [6] and again demonstrate that zero perception loss can be achieved with a $3$-dB penalty in the minimum distortion. Finally we specialize our results to the case of Gaussian sources. We derive the RDP function for vector Gaussian sources and propose a waterfilling type solution. We also partially characterize the RDP function for a mixture of vector Gaussians.

arxiv情報

著者 Sadaf Salehkalaibar,Jun Chen,Ashish Khisti,Wei Yu
発行日 2024-01-22 18:49:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT パーマリンク