What can we learn about a generated image corrupting its latent representation?


敵対的生成ネットワーク (GAN) は、画像から画像への変換の問題に対する効果的なソリューションを提供し、それによって医用画像処理の新しい可能性を可能にします。
この作業の目的は、GAN のボトルネックにおける潜在的な表現に基づいて画質を予測できるという仮説を調査することです。
私たちの結果は、提案された方法が、i) 合成画像の不確実な部分を予測する能力、および ii) 下流のタスク (例えば、肝臓のセグメンテーション タスク) に対して信頼できない可能性があるサンプルを識別する能力を持っていることを示しています。


Generative adversarial networks (GANs) offer an effective solution to the image-to-image translation problem, thereby allowing for new possibilities in medical imaging. They can translate images from one imaging modality to another at a low cost. For unpaired datasets, they rely mostly on cycle loss. Despite its effectiveness in learning the underlying data distribution, it can lead to a discrepancy between input and output data. The purpose of this work is to investigate the hypothesis that we can predict image quality based on its latent representation in the GANs bottleneck. We achieve this by corrupting the latent representation with noise and generating multiple outputs. The degree of differences between them is interpreted as the strength of the representation: the more robust the latent representation, the fewer changes in the output image the corruption causes. Our results demonstrate that our proposed method has the ability to i) predict uncertain parts of synthesized images, and ii) identify samples that may not be reliable for downstream tasks, e.g., liver segmentation task.


著者 Agnieszka Tomczak,Aarushi Gupta,Slobodan Ilic,Nassir Navab,Shadi Albarqouni
発行日 2022-10-12 14:40:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク