要約
ディープ ニューラル ネットワークは、医用画像解析に目覚ましいブレークスルーをもたらしました。
ただし、データを大量に消費する性質があるため、医療画像プロジェクトの適度なデータセット サイズは、その可能性を最大限に妨げている可能性があります。
合成データの生成は有望な代替手段であり、トレーニング データセットを補完し、大規模な医用画像研究を実施することができます。
拡散モデルは、最近、写実的な合成画像を生成することで、コンピューター ビジョン コミュニティの注目を集めています。
この研究では、潜在拡散モデルを使用して、高解像度の 3D 脳画像から合成画像を生成する方法を探ります。
UK Biobank データセット (N=31,740) の T1w MRI 画像を使用してモデルをトレーニングし、年齢、性別、脳構造ボリュームなどの共変数で条件付けされた脳画像の確率分布について学習しました。
モデルが現実的なデータを作成し、条件付け変数を使用してデータ生成を効果的に制御できることがわかりました。
それに加えて、100,000 の脳画像を含む合成データセットを作成し、科学コミュニティに公開しました。
要約(オリジナル)
Deep neural networks have brought remarkable breakthroughs in medical image analysis. However, due to their data-hungry nature, the modest dataset sizes in medical imaging projects might be hindering their full potential. Generating synthetic data provides a promising alternative, allowing to complement training datasets and conducting medical image research at a larger scale. Diffusion models recently have caught the attention of the computer vision community by producing photorealistic synthetic images. In this study, we explore using Latent Diffusion Models to generate synthetic images from high-resolution 3D brain images. We used T1w MRI images from the UK Biobank dataset (N=31,740) to train our models to learn about the probabilistic distribution of brain images, conditioned on covariables, such as age, sex, and brain structure volumes. We found that our models created realistic data, and we could use the conditioning variables to control the data generation effectively. Besides that, we created a synthetic dataset with 100,000 brain images and made it openly available to the scientific community.
arxiv情報
著者 | Walter H. L. Pinaya,Petru-Daniel Tudosiu,Jessica Dafflon,Pedro F da Costa,Virginia Fernandez,Parashkev Nachev,Sebastien Ourselin,M. Jorge Cardoso |
発行日 | 2022-09-15 09:16:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google