SF2Former: Amyotrophic Lateral Sclerosis Identification From Multi-center MRI Data Using Spatial and Frequency Fusion Transformer

要約

筋萎縮性側索硬化症 (ALS) は、運動ニューロンの変性を伴う複雑な神経変性疾患です。
病気の状態を診断および監視するための潜在的なバイオマーカーとして、脳の磁気共鳴画像法 (MRI) を確立するための重要な研究が始まっています。
ディープ ラーニングは、コンピューター ビジョンにおける機械学習プログラムの傑出したクラスになり、さまざまな医療画像分析タスクを解決するためにうまく採用されています。
ただし、ニューロ イメージングに適用される深層学習ベースの方法は、病理学的特徴と相関する構造変化がわずかであるため、健康なコントロールからの ALS 患者の分類において優れたパフォーマンスを達成していません。
したがって、ディープ モデルの重要な課題は、限られたトレーニング データで有用な識別機能を決定することです。
画像特徴の長期的な関係を利用することにより、この研究では、SF2Former という名前のフレームワークを紹介します。このフレームワークは、ビジョン トランスフォーマー アーキテクチャの力を活用して、ALS 被験者を対照群から区別します。
MRI スキャンは空間ドメインに変換される前に周波数ドメインでキャプチャされるため、ネットワークのパフォーマンスをさらに向上させるために、空間ドメインと周波数ドメインの情報が結合されます。
提案されたフレームワークは、転移学習を活用して ImageNet で事前にトレーニングされた重みを使用する一連の連続した冠状 2D スライスでトレーニングされます。
最後に、特定の被験者の冠状スライスに対して多数決方式が採用され、最終的な分類決定が行われました。
提案されたアーキテクチャは、カナダ ALS ニューロイメージング コンソーシアム (CALSNIC) マルチセンター データセットの 2 つのよく組織化されたバージョンを使用して、マルチモーダル ニューロ イメージング データで徹底的に評価されています。
実験結果は、いくつかの一般的な深層学習ベースの手法と比較して、分類精度の点で提案された戦略の優位性を示しています。

要約(オリジナル)

Amyotrophic Lateral Sclerosis (ALS) is a complex neurodegenerative disorder involving motor neuron degeneration. Significant research has begun to establish brain magnetic resonance imaging (MRI) as a potential biomarker to diagnose and monitor the state of the disease. Deep learning has turned into a prominent class of machine learning programs in computer vision and has been successfully employed to solve diverse medical image analysis tasks. However, deep learning-based methods applied to neuroimaging have not achieved superior performance in ALS patients classification from healthy controls due to having insignificant structural changes correlated with pathological features. Therefore, the critical challenge in deep models is to determine useful discriminative features with limited training data. By exploiting the long-range relationship of image features, this study introduces a framework named SF2Former that leverages vision transformer architecture’s power to distinguish the ALS subjects from the control group. To further improve the network’s performance, spatial and frequency domain information are combined because MRI scans are captured in the frequency domain before being converted to the spatial domain. The proposed framework is trained with a set of consecutive coronal 2D slices, which uses the pre-trained weights on ImageNet by leveraging transfer learning. Finally, a majority voting scheme has been employed to those coronal slices of a particular subject to produce the final classification decision. Our proposed architecture has been thoroughly assessed with multi-modal neuroimaging data using two well-organized versions of the Canadian ALS Neuroimaging Consortium (CALSNIC) multi-center datasets. The experimental results demonstrate the superiority of our proposed strategy in terms of classification accuracy compared with several popular deep learning-based techniques.

arxiv情報

著者 Rafsanjany Kushol,Collin C. Luk,Avyarthana Dey,Michael Benatar,Hannah Briemberg,Annie Dionne,Nicolas Dupré,Richard Frayne,Angela Genge,Summer Gibson,Simon J. Graham,Lawrence Korngut,Peter Seres,Robert C. Welsh,Alan Wilman,Lorne Zinman,Sanjay Kalra,Yee-Hong Yang
発行日 2023-02-21 18:16:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク