Inpainting Pathology in Lumbar Spine MRI with Latent Diffusion

要約

放射線医学における自動診断のためのデータ駆動型モデルは、母集団における病理の表現が少ないことと専門家の注釈のコストが原因で、データセットが不十分で不均衡であるという問題に悩まされています。
データセットはデータ拡張を通じて強化できます。
ただし、モデルのトレーニング中に一連の変換をすべて利用した場合でも、一般的なデータ拡張では人間の解剖学的構造の変化に対応できません。
別の方向性は、特定の属性を持つデータセットを作成できる可能性がある生成モデルを使用してデータを合成することです。
これは有望ですが、敵対的生成ネットワークなどの一般的に使用される生成モデルは、解剖学的に不正確な特徴を誤って生成する可能性があります。
一方で、安定性が高い拡散モデルはトレーニング データを記憶する傾向があり、プライバシーと生成的多様性に関する懸念が生じます。
あるいは、修復には、医療画像に病理を直接挿入することでデータを増強する可能性があります。
ただし、このアプローチでは、生成された病理学的特徴を周囲の解剖学的コンテキストと正確に統合するという新たな課題が生じます。
インペインティングは単純な病変に対処するための十分に確立された方法ですが、複雑な構造変化を伴う病理への適用は比較的未開発のままです。
我々は、潜在拡散モデルにおけるボクセルごとのノイズスケジューリングを通じて、MRIの健康な解剖学的構造に病理学的特徴を修復するための効率的な方法を提案します。
我々は、腰椎矢状T2 MRIで椎間板ヘルニアと中心管狭窄症を挿入するこの方法の能力を評価し、最先端の方法と比較して優れたフレシェ開始距離を達成しました。

要約(オリジナル)

Data driven models for automated diagnosis in radiology suffer from insufficient and imbalanced datasets due to low representation of pathology in a population and the cost of expert annotations. Datasets can be bolstered through data augmentation. However, even when utilizing a full suite of transformations during model training, typical data augmentations do not address variations in human anatomy. An alternative direction is to synthesize data using generative models, which can potentially craft datasets with specific attributes. While this holds promise, commonly used generative models such as Generative Adversarial Networks may inadvertently produce anatomically inaccurate features. On the other hand, diffusion models, which offer greater stability, tend to memorize training data, raising concerns about privacy and generative diversity. Alternatively, inpainting has the potential to augment data through directly inserting pathology in medical images. However, this approach introduces a new challenge: accurately merging the generated pathological features with the surrounding anatomical context. While inpainting is a well established method for addressing simple lesions, its application to pathologies that involve complex structural changes remains relatively unexplored. We propose an efficient method for inpainting pathological features onto healthy anatomy in MRI through voxelwise noise scheduling in a latent diffusion model. We evaluate the method’s ability to insert disc herniation and central canal stenosis in lumbar spine sagittal T2 MRI, and it achieves superior Frechet Inception Distance compared to state-of-the-art methods.

arxiv情報

著者 Colin Hansen,Simas Glinskis,Ashwin Raju,Micha Kornreich,JinHyeong Park,Jayashri Pawar,Richard Herzog,Li Zhang,Benjamin Odry
発行日 2024-06-04 16:47:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク