Adaptive Input-image Normalization for Solving the Mode Collapse Problem in GAN-based X-ray Images

要約

対象となる疾患の希少性により、生物医学画像データセットの不均衡が生じる可能性があります。
Generative Adversarial Networks は、データセットを増強する合成画像の生成を可能にすることで、この不均衡に対処する上で重要な役割を果たします。
トレーニング画像に存在する特徴の分布を正確に表現するには、さまざまな特徴を組み込んだ合成画像を生成することが重要です。
さらに、合成画像に多様な特徴が欠けていると、機械学習分類器のパフォーマンスが低下する可能性があります。
モード崩壊の問題は、敵対的生成ネットワークの多様な画像を生成する能力に影響を与えます。
モード崩壊には、クラス内とクラス間の 2 種類があります。
この論文では、両方の種類のモード崩壊問題が調査され、合成 X 線画像の多様性に対するその後の影響が評価されます。
この研究は、適応入力画像正規化を深層畳み込み GAN および補助分類器 GAN と統合してモード崩壊の問題を軽減する利点の実証的実証に貢献します。
合成的に生成された画像は、データ拡張と Vision Transformer モデルのトレーニングに利用されます。
モデルの分類パフォーマンスは、精度、再現率、精度スコアを使用して評価されます。
結果は、優れた多様性スコアと分類スコアによって証明されるように、適応入力画像正規化を備えた DCGAN および ACGAN が、正規化されていない X 線画像を備えた DCGAN および ACGAN よりも優れていることを示しています。

要約(オリジナル)

Biomedical image datasets can be imbalanced due to the rarity of targeted diseases. Generative Adversarial Networks play a key role in addressing this imbalance by enabling the generation of synthetic images to augment datasets. It is important to generate synthetic images that incorporate a diverse range of features to accurately represent the distribution of features present in the training imagery. Furthermore, the absence of diverse features in synthetic images can degrade the performance of machine learning classifiers. The mode collapse problem impacts Generative Adversarial Networks’ capacity to generate diversified images. Mode collapse comes in two varieties: intra-class and inter-class. In this paper, both varieties of the mode collapse problem are investigated, and their subsequent impact on the diversity of synthetic X-ray images is evaluated. This work contributes an empirical demonstration of the benefits of integrating the adaptive input-image normalization with the Deep Convolutional GAN and Auxiliary Classifier GAN to alleviate the mode collapse problems. Synthetically generated images are utilized for data augmentation and training a Vision Transformer model. The classification performance of the model is evaluated using accuracy, recall, and precision scores. Results demonstrate that the DCGAN and the ACGAN with adaptive input-image normalization outperform the DCGAN and ACGAN with un-normalized X-ray images as evidenced by the superior diversity scores and classification scores.

arxiv情報

著者 Muhammad Muneeb Saad,Mubashir Husain Rehmani,Ruairi O’Reilly
発行日 2024-04-29 17:19:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク