Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data Augmentation and Deep Ensemble Learning


タイトル: 3D解剖MRIにおけるCNNの基準化:アーキテクチャ、データ拡張、深層アンサンブル学習

– CNNモデルは広範なビジョンのタスクにおいて、従来の機械学習手法を上回るデファクト手法になっています。
– このため、3D anatomical brain MRIを用いた神経イメージング分野において、フェノタイプ予測やコンピュータ支援診断などにおいて注目の的となっています。
– しかし、多くの現在の研究は、特定の前処理パイプラインやカスタムCNNアーキテクチャとともに小規模な単一サイトコートを扱っており、比較が困難です。
– このため、我々は最新のステートオブジアート(SOTA)3D CNNの包括的なベンチマークを提案し、データ拡張やディープアンサンブル学習の利点も評価しました。評価対象は、VBM前処理と準生データにおいて、N=10kのスキャンに対して、年齢予測、性別分類、統合失調症診断の3つのタスクに焦点を当てました。
– すべてのモデルが、VBM画像に対して、ほぼ生データよりも優れた予測を提供します。
– 現在のCNNは、N=10k多拠点画像で訓練された場合でも、取得サイトに非常にバイアスがあることがわかりました。
– 惜しいことに、データ拡張技術からは明確な利点が見いだされませんでした。
– 最終的に、深いアンサンブル学習が、性能を犠牲にすることなく、大規模なCNNモデルを再キャリブレーションするために適していることが証明されました。


Deep Learning (DL) and specifically CNN models have become a de facto method for a wide range of vision tasks, outperforming traditional machine learning (ML) methods. Consequently, they drew a lot of attention in the neuroimaging field in particular for phenotype prediction or computer-aided diagnosis. However, most of the current studies often deal with small single-site cohorts, along with a specific pre-processing pipeline and custom CNN architectures, which make them difficult to compare to. We propose an extensive benchmark of recent state-of-the-art (SOTA) 3D CNN, evaluating also the benefits of data augmentation and deep ensemble learning, on both Voxel-Based Morphometry (VBM) pre-processing and quasi-raw images. Experiments were conducted on a large multi-site 3D brain anatomical MRI data-set comprising N=10k scans on 3 challenging tasks: age prediction, sex classification, and schizophrenia diagnosis. We found that all models provide significantly better predictions with VBM images than quasi-raw data. This finding evolved as the training set approaches 10k samples where quasi-raw data almost reach the performance of VBM. Moreover, we showed that linear models perform comparably with SOTA CNN on VBM data. We also demonstrated that DenseNet and tiny-DenseNet, a lighter version that we proposed, provide a good compromise in terms of performance in all data regime. Therefore, we suggest to employ them as the architectures by default. Critically, we also showed that current CNN are still very biased towards the acquisition site, even when trained with N=10k multi-site images. In this context, VBM pre-processing provides an efficient way to limit this site effect. Surprisingly, we did not find any clear benefit from data augmentation techniques. Finally, we proved that deep ensemble learning is well suited to re-calibrate big CNN models without sacrificing performance.


著者 Benoit Dufumier,Pietro Gori,Ilaria Battaglia,Julie Victor,Antoine Grigis,Edouard Duchesnay
発行日 2023-04-17 12:48:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク