Fast Unsupervised Brain Anomaly Detection and Segmentation with Diffusion Models


深層生成モデルは、手動によるラベリングの必要性を払拭し、データ中の任意の異常を検出するための有望なツールとして浮上してきた。近年、自己回帰変換器は、医療画像における異常検出において最先端の性能を達成している。しかし、これらのモデルは、画像を1次元シーケンスとしてモデル化する必要があること、サンプリングプロセス中に誤差が蓄積されること、変換器に関連する推論時間が長いことなど、いくつかの本質的な弱点を依然として有している。デノイジング拡散確率モデルは、最近、コンピュータビジョンにおいて優れたサンプルを生成し(Generative Adversarial Networksを上回る)、高速な推論時間を持ちながら変換器と競合する対数尤度を達成することが示された非自己回帰型生成モデルの一種である。拡散モデルはオートエンコーダで学習した潜在表現に適用できるため、拡張性が高く、医用画像のような高次元データへの適用に最適である。本論文では、脳画像における異常の検出と分割のための拡散モデルに基づいた手法を提案する。健常データでモデルを学習し、そのマルコフ連鎖の拡散と逆ステップを探索することで、潜在空間における異常領域を特定し、その結果、画素空間における異常を特定することができる。我々の拡散モデルは、合成病変と実病変を含む2次元CTとMRIデータを用いた一連の実験において、自己回帰的アプローチと比較して、推論時間を大幅に短縮し、臨床での利用を可能にする性能を達成した。


Deep generative models have emerged as promising tools for detecting arbitrary anomalies in data, dispensing with the necessity for manual labelling. Recently, autoregressive transformers have achieved state-of-the-art performance for anomaly detection in medical imaging. Nonetheless, these models still have some intrinsic weaknesses, such as requiring images to be modelled as 1D sequences, the accumulation of errors during the sampling process, and the significant inference times associated with transformers. Denoising diffusion probabilistic models are a class of non-autoregressive generative models recently shown to produce excellent samples in computer vision (surpassing Generative Adversarial Networks), and to achieve log-likelihoods that are competitive with transformers while having fast inference times. Diffusion models can be applied to the latent representations learnt by autoencoders, making them easily scalable and great candidates for application to high dimensional data, such as medical images. Here, we propose a method based on diffusion models to detect and segment anomalies in brain imaging. By training the models on healthy data and then exploring its diffusion and reverse steps across its Markov chain, we can identify anomalous areas in the latent space and hence identify anomalies in the pixel space. Our diffusion models achieve competitive performance compared with autoregressive approaches across a series of experiments with 2D CT and MRI data involving synthetic and real pathological lesions with much reduced inference times, making their usage clinically viable.


著者 Walter H. L. Pinaya,Mark S. Graham,Robert Gray,Pedro F Da Costa,Petru-Daniel Tudosiu,Paul Wright,Yee H. Mah,Andrew D. MacKinnon,James T. Teo,Rolf Jager,David Werring,Geraint Rees,Parashkev Nachev,Sebastien Ourselin,M. Jorge Cardoso
発行日 2022-06-07 17:30:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CV, eess.IV, q-bio.QM パーマリンク