Decomposing 3D Neuroimaging into 2+1D Processing for Schizophrenia Recognition

要約

ディープラーニングは、自然画像と医用画像の両方の認識にうまく適用されています。
ただし、特に統合失調症やうつ病などの特定のスライスに目に見える変化がない精神疾患の場合、3D ニューロ イメージング データの認識にはギャップが残っています。
この研究では、2+1D フレームワークによって 3D データを処理することを提案します。これにより、3D ニューロイメージング認識のために巨大な ImageNet データセットで事前にトレーニングされた強力なディープ 2D 畳み込みニューラル ネットワーク (CNN) ネットワークを利用できるようになります。
具体的には、磁気共鳴画像法 (MRI) メトリクス (灰白質、白質、および脳脊髄液) の 3D ボリュームは、隣接するボクセル位置に従って 2D スライスに分解され、ImageNet で事前にトレーニングされた 2D CNN モデルに入力され、そこから特徴マップを抽出します。
3 つのビュー (軸、冠状、および矢状)。
活性化パターンは特徴マップ上にまばらに分散されているため、冗長な情報を削除するためにグローバル プーリングが適用されます。
チャネル単位およびスライス単位の畳み込みは、2D CNN モデルによって処理されない 3 番目のビュー次元でコンテキスト情報を集約するために提案されています。
マルチメトリックとマルチビューの情報が融合され、最終的な予測が行われます。
私たちのアプローチは、手作りの特徴ベースの機械学習、サポート ベクター マシン (SVM) 分類器を使用した深い特徴アプローチ、ゼロからトレーニングされた 3D CNN モデルよりも優れており、公開されているノースウェスタン大学の統合失調症データセットでより優れた交差検証結果が得られ、結果は別の独立したデータセットで複製されます。
データセット。

要約(オリジナル)

Deep learning has been successfully applied to recognizing both natural images and medical images. However, there remains a gap in recognizing 3D neuroimaging data, especially for psychiatric diseases such as schizophrenia and depression that have no visible alteration in specific slices. In this study, we propose to process the 3D data by a 2+1D framework so that we can exploit the powerful deep 2D Convolutional Neural Network (CNN) networks pre-trained on the huge ImageNet dataset for 3D neuroimaging recognition. Specifically, 3D volumes of Magnetic Resonance Imaging (MRI) metrics (grey matter, white matter, and cerebrospinal fluid) are decomposed to 2D slices according to neighboring voxel positions and inputted to 2D CNN models pre-trained on the ImageNet to extract feature maps from three views (axial, coronal, and sagittal). Global pooling is applied to remove redundant information as the activation patterns are sparsely distributed over feature maps. Channel-wise and slice-wise convolutions are proposed to aggregate the contextual information in the third view dimension unprocessed by the 2D CNN model. Multi-metric and multi-view information are fused for final prediction. Our approach outperforms handcrafted feature-based machine learning, deep feature approach with a support vector machine (SVM) classifier and 3D CNN models trained from scratch with better cross-validation results on publicly available Northwestern University Schizophrenia Dataset and the results are replicated on another independent dataset.

arxiv情報

著者 Mengjiao Hu,Xudong Jiang,Kang Sim,Juan Helen Zhou,Cuntai Guan
発行日 2022-11-21 15:22:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク