Feature robustness and sex differences in medical imaging: a case study in MRI-based Alzheimer’s disease detection

要約

畳み込みニューラルネットワークにより、医用画像ベースの診断が大幅に改善されました。
ただし、これらのモデルは、疑似相関やデータセットシフトに直面したときにパフォーマンスが低下しやすく、たとえば、過小評価された患者グループのパフォーマンスが低下する可能性があることがますます明らかになっています。
この論文では、ADNI MRIデータセットの2つの分類スキームを比較します。手動で選択された体積特徴を使用する単純なロジスティック回帰モデルと、3DMRIデータでトレーニングされた畳み込みニューラルネットワークです。
さまざまなデータセットの分割、トレーニングセットの性比、および疾患の段階に直面して、トレーニングされたモデルの堅牢性を評価します。
他の画像モダリティでの以前の作業とは対照的に、トレーニングデータセットの大多数のグループのモデルパフォーマンスの改善の明確なパターンは観察されません。
代わりに、ロジスティック回帰はデータセットの構成に対して完全に堅牢ですが、トレーニングデータセットに女性の被験者を含めると、CNNのパフォーマンスは一般に男性と女性の両方の被験者で改善されることがわかります。
これは、両性の病理に固有の違いが原因である可能性があると仮定します。
さらに、私たちの分析では、ロジスティック回帰モデルは3D CNNよりも優れており、事前の知識に基づく手動の特徴仕様の有用性と、より堅牢な自動特徴選択の必要性を強調しています。

要約(オリジナル)

Convolutional neural networks have enabled significant improvements in medical image-based diagnosis. It is, however, increasingly clear that these models are susceptible to performance degradation when facing spurious correlations and dataset shift, leading, e.g., to underperformance on underrepresented patient groups. In this paper, we compare two classification schemes on the ADNI MRI dataset: a simple logistic regression model using manually selected volumetric features, and a convolutional neural network trained on 3D MRI data. We assess the robustness of the trained models in the face of varying dataset splits, training set sex composition, and stage of disease. In contrast to earlier work in other imaging modalities, we do not observe a clear pattern of improved model performance for the majority group in the training dataset. Instead, while logistic regression is fully robust to dataset composition, we find that CNN performance is generally improved for both male and female subjects when including more female subjects in the training dataset. We hypothesize that this might be due to inherent differences in the pathology of the two sexes. Moreover, in our analysis, the logistic regression model outperforms the 3D CNN, emphasizing the utility of manual feature specification based on prior knowledge, and the need for more robust automatic feature selection.

arxiv情報

著者 Eike Petersen,Aasa Feragen,Maria Luise da Costa Zemsch,Anders Henriksen,Oskar Eiler Wiese Christensen,Melanie Ganz
発行日 2022-07-14 16:35:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク