A Survey on Training Challenges in Generative Adversarial Networks for Biomedical Image Analysis

要約

生物医学画像解析では、ディープ ラーニング手法の適用可能性は、利用可能な画像データの量によって直接影響を受けます。
これは、高レベルのパフォーマンスを提供するために大規模な画像データセットを必要とするディープ ラーニング モデルによるものです。
Generative Adversarial Networks (GAN) は、合成生物医学画像の生成を通じてデータの制限に対処するために広く利用されています。
GAN は 2 つのモデルで構成されます。
ジェネレーターは、受け取ったフィードバックに基づいて合成画像を生成する方法を学習するモデルです。
ディスクリミネータ (画像を合成か本物かを分類し、ジェネレータにフィードバックを提供するモデル)。
トレーニング プロセス全体を通して、GAN は、適切な合成画像の生成を妨げるいくつかの技術的課題を経験する可能性があります。
1 つ目は、ジェネレータが同一の画像を生成するか、異なる入力フィーチャから均一な画像を生成するモード崩壊の問題です。
2 つ目は、勾配降下オプティマイザーがナッシュ均衡に到達できないという非収束の問題です。
第 3 に、ディスクリミネータが最適な分類パフォーマンスを達成するために不安定なトレーニング動作が発生する勾配消失問題により、生成器に意味のあるフィードバックが提供されなくなります。
これらの問題により、ぼやけて非現実的で多様性の低い合成画像が生成されます。
今日まで、生物医学画像領域のコンテキストにおけるこれらの技術的課題の影響を概説した調査記事はありません。
この作品は、生物医学イメージング ドメインにおける GANs のトレーニング問題の解決策に基づくレビューと分類法を提示します。
この調査は、重要な課題を浮き彫りにし、生物医学画像の領域における GAN のトレーニングに関する将来の研究の方向性を概説します。

要約(オリジナル)

In biomedical image analysis, the applicability of deep learning methods is directly impacted by the quantity of image data available. This is due to deep learning models requiring large image datasets to provide high-level performance. Generative Adversarial Networks (GANs) have been widely utilized to address data limitations through the generation of synthetic biomedical images. GANs consist of two models. The generator, a model that learns how to produce synthetic images based on the feedback it receives. The discriminator, a model that classifies an image as synthetic or real and provides feedback to the generator. Throughout the training process, a GAN can experience several technical challenges that impede the generation of suitable synthetic imagery. First, the mode collapse problem whereby the generator either produces an identical image or produces a uniform image from distinct input features. Second, the non-convergence problem whereby the gradient descent optimizer fails to reach a Nash equilibrium. Thirdly, the vanishing gradient problem whereby unstable training behavior occurs due to the discriminator achieving optimal classification performance resulting in no meaningful feedback being provided to the generator. These problems result in the production of synthetic imagery that is blurry, unrealistic, and less diverse. To date, there has been no survey article outlining the impact of these technical challenges in the context of the biomedical imagery domain. This work presents a review and taxonomy based on solutions to the training problems of GANs in the biomedical imaging domain. This survey highlights important challenges and outlines future research directions about the training of GANs in the domain of biomedical imagery.

arxiv情報

著者 Muhammad Muneeb Saad,Ruairi O’Reilly,Mubashir Husain Rehmani
発行日 2022-12-29 17:34:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク