要約
さまざまな臨床アプリケーションにおける機械学習モデルの普及により、忠実度の高い医療画像トレーニング データのニーズが高まっています。
このようなデータは、コストの制約やプライバシー上の懸念により、不足していることがよくあります。
この負担を軽減するために、敵対的生成ネットワーク (GAN) を介した医用画像合成は、実際の医用画像の既存のセットに基づいてフォトリアリスティックな画像を合成的に生成する強力な方法として登場しました。
ただし、このような GAN を効率的にトレーニングするために必要な正確な画像セットのサイズは不明です。
この研究では、データセットの画像の複雑さの分布を考慮して、サンプル データセットのサイズと生成された画像の忠実度の間の関係を測定するベンチマークを実験的に確立します。
私たちは、情報理論におけるシャノンのエントロピーに根ざした画像の複雑さの尺度であるデレントロピーに基づいて統計指標を分析します。
私たちのパイプラインでは、可変サンプルサイズの複数の医療画像データセットでトレーニングされた 2 つの最先端の GAN、StyleGAN 3 と SPADE-GAN を使用して実験を実施します。
どちらの GAN においても、トレーニング セットのサイズが増加するにつれて全体的なパフォーマンスは向上しましたが、複雑さが増すにつれてパフォーマンスは低下しました。
要約(オリジナル)
The proliferation of machine learning models in diverse clinical applications has led to a growing need for high-fidelity, medical image training data. Such data is often scarce due to cost constraints and privacy concerns. Alleviating this burden, medical image synthesis via generative adversarial networks (GANs) emerged as a powerful method for synthetically generating photo-realistic images based on existing sets of real medical images. However, the exact image set size required to efficiently train such a GAN is unclear. In this work, we experimentally establish benchmarks that measure the relationship between a sample dataset size and the fidelity of the generated images, given the dataset’s distribution of image complexities. We analyze statistical metrics based on delentropy, an image complexity measure rooted in Shannon’s entropy in information theory. For our pipeline, we conduct experiments with two state-of-the-art GANs, StyleGAN 3 and SPADE-GAN, trained on multiple medical imaging datasets with variable sample sizes. Across both GANs, general performance improved with increasing training set size but suffered with increasing complexity.
arxiv情報
著者 | William Cagas,Chan Ko,Blake Hsiao,Shryuk Grandhi,Rishi Bhattacharya,Kevin Zhu,Michael Lam |
発行日 | 2024-10-23 15:28:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google