要約
公的に利用可能な医療画像データが不足しているため、効果的な AI モデルの開発が制限されています。
この研究では、肺結節のある CT スキャンに焦点を当て、合成医用画像を生成するためのメモリ効率の高いパッチごとのノイズ除去拡散確率モデル (DDPM) を提案します。
私たちのアプローチは、メモリ制約を効率的に管理しながら結節セグメンテーションを使用して実用性の高い合成画像を生成し、トレーニング データセットの作成を可能にします。
この方法を 2 つのシナリオで評価します。合成データのみでセグメンテーション モデルをトレーニングするシナリオと、合成画像を使用して現実世界のトレーニング データを強化するシナリオです。
最初のケースでは、合成データのみでトレーニングされたモデルは、現実世界のデータ ベンチマークでトレーニングされたモデルと同等の Dice スコアを達成します。
2 番目のケースでは、実世界のデータを合成画像で補強することで、セグメンテーションのパフォーマンスが大幅に向上します。
生成された画像は、現実世界のデータが限られているシナリオで医療画像データセットを強化できる可能性を示しています。
要約(オリジナル)
The scarcity of publicly available medical imaging data limits the development of effective AI models. This work proposes a memory-efficient patch-wise denoising diffusion probabilistic model (DDPM) for generating synthetic medical images, focusing on CT scans with lung nodules. Our approach generates high-utility synthetic images with nodule segmentation while efficiently managing memory constraints, enabling the creation of training datasets. We evaluate the method in two scenarios: training a segmentation model exclusively on synthetic data, and augmenting real-world training data with synthetic images. In the first case, models trained solely on synthetic data achieve Dice scores comparable to those trained on real-world data benchmarks. In the second case, augmenting real-world data with synthetic images significantly improves segmentation performance. The generated images demonstrate their potential to enhance medical image datasets in scenarios with limited real-world data.
arxiv情報
著者 | Kathrin Khadra,Utku Türkbey |
発行日 | 2024-10-16 13:20:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google