要約
公的に利用可能な糖尿病性網膜症 (DR) データセットは不均衡であり、DR を含む画像の数が限られています。
この不均衡は、機械学習分類器をトレーニングする際の過剰適合の一因となります。
この不均衡の影響は、DR 段階の重大度が増すにつれて悪化し、分類器の診断能力に影響を与えます。
この不均衡は、敵対的生成ネットワーク (GAN) を使用してデータセットを合成画像で強化することで対処できます。
合成画像の生成は、高品質で多様な画像を生成する場合に有利です。
合成画像の品質と多様性を評価するには、マルチスケール構造類似性指数 (MS-SSIM)、コサイン距離 (CD)、およびフレチェ開始距離 (FID) などのいくつかの評価指標が使用されます。
拡張用の画像を選択するには、GAN ベースの合成画像の品質と多様性を評価する際の各指標の有効性を理解することが重要です。
現在までのところ、生物医学画像に関連したこれらの指標の適切性に関する分析は限られています。
この研究は、Deep Convolutional GAN (DCGAN) によって生成された合成増殖 DR 画像に適用されるこれらの評価指標の経験的評価に貢献します。
さらに、合成画像の品質と多様性、および分類器のパフォーマンスとの相関を示すメトリクスの能力が検討されます。
これにより、合成画像の定量的な選択と、情報に基づいた拡張戦略が可能になります。
その結果、品質の評価には FID が適しており、合成画像の多様性の評価には MS-SSIM と CD が適していることがわかりました。
さらに、F1 スコアと AUC スコアで示されるように、強化されたデータセットに対する畳み込みニューラル ネットワーク (CNN) と EfficientNet 分類器の優れたパフォーマンスは、不均衡なデータセットを強化する合成画像の有効性を示しています。
要約(オリジナル)
Publicly available diabetic retinopathy (DR) datasets are imbalanced, containing limited numbers of images with DR. This imbalance contributes to overfitting when training machine learning classifiers. The impact of this imbalance is exacerbated as the severity of the DR stage increases, affecting the classifiers’ diagnostic capacity. The imbalance can be addressed using Generative Adversarial Networks (GANs) to augment the datasets with synthetic images. Generating synthetic images is advantageous if high-quality and diversified images are produced. To evaluate the quality and diversity of synthetic images, several evaluation metrics, such as Multi-Scale Structural Similarity Index (MS-SSIM), Cosine Distance (CD), and Fr\’echet Inception Distance (FID) are used. Understanding the effectiveness of each metric in evaluating the quality and diversity of GAN-based synthetic images is critical to select images for augmentation. To date, there has been limited analysis of the appropriateness of these metrics in the context of biomedical imagery. This work contributes an empirical assessment of these evaluation metrics as applied to synthetic Proliferative DR imagery generated by a Deep Convolutional GAN (DCGAN). Furthermore, the metrics’ capacity to indicate the quality and diversity of synthetic images and a correlation with classifier performance is undertaken. This enables a quantitative selection of synthetic imagery and an informed augmentation strategy. Results indicate that FID is suitable for evaluating the quality, while MS-SSIM and CD are suitable for evaluating the diversity of synthetic imagery. Furthermore, the superior performance of Convolutional Neural Network (CNN) and EfficientNet classifiers, as indicated by the F1 and AUC scores, for the augmented datasets demonstrates the efficacy of synthetic imagery to augment the imbalanced dataset.
arxiv情報
著者 | Cristina-Madalina Dragan,Muhammad Muneeb Saad,Mubashir Husain Rehmani,Ruairi O’Reilly |
発行日 | 2023-05-15 10:44:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google