EVAC+: Multi-scale V-net with Deep Feature CRF Layers for Brain Extraction

要約

脳抽出は、3次元脳MRIデータの前処理の最初のステップの一つであり、これから行う脳画像解析の前提条件となるものである。しかし,脳や頭部は複雑な構造をしているため,単純なセグメンテーション問題ではありません.これまでにも様々な解決策が提案されているが、真にロバストな手法には至っていない。これまでの手法では、構造的/幾何学的な事前分布を用いた機械学習が用いられてきましたが、Deep Learning(DL)の発展とともに、Neural Networkアーキテクチャの提案が増加しています。ほとんどのモデルは、アーキテクチャにほとんど変更を加えることなく、学習データと損失関数を改善することに重点を置いています。しかし、専門家がラベル付けしたグランドトゥルースを持つアクセス可能な学習データの量は、グループによって異なります。さらに、ラベルはゼロから作成されるのではなく、非DL手法の出力から作成される。このように、ほとんどのDL手法はデータの量と質に性能が依存する。本論文では、この問題を解決するために、EVAC+と呼ぶ新しいアーキテクチャを提案する。EVAC+は、(1)マルチスケール入力、(2)条件付きランダムフィールドリカレント層、(3)損失関数という、他のネットワークとは異なる3つの大きな利点を持つことを明らかにする。我々は、本モデルを最先端の非DLおよびDL手法と比較した。その結果、従来のアーキテクチャをほとんど変更せず、限られた学習資源で、EVAC+は高く安定したダイス係数とジャカード指数を達成し、望ましい低い表面距離を実現することが分かった。最終的に、我々のモデルは、脳の複雑な多組織連関領域におけるセグメンテーションエラーを正確に低減するためのロバストな方法を提供する。

要約(オリジナル)

Brain extraction is one of the first steps of pre-processing 3D brain MRI data and a prerequisite for any forthcoming brain imaging analyses. However, it is not a simple segmentation problem due to the complex structure of the brain and human head. Although multiple solutions have been proposed in the literature, we are still far from having truly robust methods. While previous methods have used machine learning with structural/geometric priors, with the development of Deep Learning (DL), there has been an increase in proposed Neural Network architectures. Most models focus on improving the training data and loss functions with little change in the architecture. However, the amount of accessible training data with expert-labelled ground truth vary between groups. Moreover, the labels are created not from scratch but from outputs of non-DL methods. Thus, most DL method’s performance depend on the amount and quality of data one has. In this paper, we propose a novel architecture we call EVAC+ to work around this issue. We show that EVAC+ has 3 major advantages compared to other networks: (1) Multi-scale input with limited random augmentation for efficient learning, (2) a unique way of using Conditional Random Fields Recurrent Layer and (3) a loss function specifically created to enhance this architecture. We compare our model to state-of-the-art non-DL and DL methods. Results show that even with little change in the traditional architecture and limited training resources, EVAC+ achieves a high and stable Dice Coefficient and Jaccard Index along with a desirable lower surface distance. Ultimately, our model provides a robust way of accurately reducing segmentation errors in complex multi-tissue interfacing areas of brain.

arxiv情報

著者 Jong Sung Park,Shreyas Fadnavis,Eleftherios Garyfallidis
発行日 2023-01-06 02:55:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク