Using Higher-Order Moments to Assess the Quality of GAN-generated Image Features

要約

Generative Adversarial Networks (GAN) の急速な進歩により、これらのモデルを堅牢に評価する必要が生じています。
確立された評価基準の中で、Fr\'{e}chet Inception Distance (FID) は、その概念的な単純さ、高速な計算時間、および人間の知覚との強い相関により広く採用されています。
ただし、FID には固有の制限があり、主に特徴の埋め込みがガウス分布に従うため、最初の 2 つのモーメントによって定義できるという仮定に起因します。
これは実際には当てはまらないため、この論文では、画像特徴データにおける 3 番目のモーメントの重要性を調査し、この情報を使用して、スキュー開始距離 (SID) と呼ばれる新しい尺度を定義します。
SID が確率分布の擬似計量であることを証明し、それが FID をどのように拡張するかを示し、その計算のための実用的な方法を示します。
私たちの数値実験は、ImageNet データの画像特徴を評価する際に、SID が FID を追跡するか、場合によっては人間の知覚とより密接に一致することを裏付けています。

要約(オリジナル)

The rapid advancement of Generative Adversarial Networks (GANs) necessitates the need to robustly evaluate these models. Among the established evaluation criteria, the Fr\'{e}chet Inception Distance (FID) has been widely adopted due to its conceptual simplicity, fast computation time, and strong correlation with human perception. However, FID has inherent limitations, mainly stemming from its assumption that feature embeddings follow a Gaussian distribution, and therefore can be defined by their first two moments. As this does not hold in practice, in this paper we explore the importance of third-moments in image feature data and use this information to define a new measure, which we call the Skew Inception Distance (SID). We prove that SID is a pseudometric on probability distributions, show how it extends FID, and present a practical method for its computation. Our numerical experiments support that SID either tracks with FID or, in some cases, aligns more closely with human perception when evaluating image features of ImageNet data.

arxiv情報

著者 Lorenzo Luzi,Helen Jenne,Ryan Murray,Carlos Ortiz Marrero
発行日 2023-10-31 17:05:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク