Leveraging GANs for data scarcity of COVID-19: Beyond the hype



– AIベースのモデルは肺のCTスキャンやX線画像からCOVID-19の診断に役立つが、これらのモデルはトレーニングと検証に大量のデータが必要とされる。
– 多くの研究者は、AIベースのモデルの性能を向上させるために、合成肺CTスキャンおよびX線画像を生成するためにGANを研究している。
– しかし、GANベースの方法が信頼性のある合成データを生成するためにどの程度優れたパフォーマンスを示すかは、十分に調査されていない。
– 本研究は、合成データ生成のためのGANを報告した43の論文を分析し、これらの研究の多くがデータの偏り、再現性の欠如、放射線科医またはその他の専門家からのフィードバックの欠如に苦しんでいることを明らかにした。
– 問題となっているのは、ソースコードの利用が不可能であることであり、再現性が阻害されていることである。
– 加えて、これらの研究には入力画像の再スケーリングが報告されているが、再スケーリングがどのように動機付けられたのかについての臨床的見解は提供されていない。
– 最後に、GANベースの方法はデータ拡張とAIベースのモデルのトレーニングの改善の可能性があるが、臨床実践においては限界がある。
– この論文は、データ不足問題に対処する研究のホットスポットを示し、様々な問題と潜在能力を特定し、将来の研究を指導するための推奨事項を提供する。これらの推奨事項は、GANによるデータ拡張がAIおよび医療画像研究コミュニティでますます人気を博する中で、GANベースのアプローチの受容性を改善するのに役立つ可能性がある。


Artificial Intelligence (AI)-based models can help in diagnosing COVID-19 from lung CT scans and X-ray images; however, these models require large amounts of data for training and validation. Many researchers studied Generative Adversarial Networks (GANs) for producing synthetic lung CT scans and X-Ray images to improve the performance of AI-based models. It is not well explored how good GAN-based methods performed to generate reliable synthetic data. This work analyzes 43 published studies that reported GANs for synthetic data generation. Many of these studies suffered data bias, lack of reproducibility, and lack of feedback from the radiologists or other domain experts. A common issue in these studies is the unavailability of the source code, hindering reproducibility. The included studies reported rescaling of the input images to train the existing GANs architecture without providing clinical insights on how the rescaling was motivated. Finally, even though GAN-based methods have the potential for data augmentation and improving the training of AI-based models, these methods fall short in terms of their use in clinical practice. This paper highlights research hotspots in countering the data scarcity problem, identifies various issues as well as potentials, and provides recommendations to guide future research. These recommendations might be useful to improve acceptability for the GAN-based approaches for data augmentation as GANs for data augmentation are increasingly becoming popular in the AI and medical imaging research community.


著者 Hazrat Ali,Christer Gronlund,Zubair Shah
発行日 2023-04-07 08:26:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク