要約
医療画像コホートは、取得デバイス、病院の場所、患者の背景などの要因によって混乱することがよくあります。
その結果、深層学習モデルは因果関係のある特徴ではなく偽の相関関係を学習する傾向があり、新しいデータやまだ見たことのないデータに対する一般化可能性が制限されます。
この問題は、タスク関連変数と非タスク関連変数の中間表現間の依存性の尺度を最小限に抑えることで解決できます。
これらの尺度には、相互情報量、距離相関、および敵対的分類子のパフォーマンスが含まれます。
ここでは、ショートカット学習を防止するタスクについて、そのような依存性対策をベンチマークします。
私たちは、Morpho-MNIST を使用した簡素化された設定と CheXpert 胸部 X 線写真を使用した医療画像タスクを研究します。
私たちの結果は、医療画像処理における交絡因子を軽減する方法についての洞察を提供します。
要約(オリジナル)
Medical imaging cohorts are often confounded by factors such as acquisition devices, hospital sites, patient backgrounds, and many more. As a result, deep learning models tend to learn spurious correlations instead of causally related features, limiting their generalizability to new and unseen data. This problem can be addressed by minimizing dependence measures between intermediate representations of task-related and non-task-related variables. These measures include mutual information, distance correlation, and the performance of adversarial classifiers. Here, we benchmark such dependence measures for the task of preventing shortcut learning. We study a simplified setting using Morpho-MNIST and a medical imaging task with CheXpert chest radiographs. Our results provide insights into how to mitigate confounding factors in medical imaging.
arxiv情報
著者 | Sarah Müller,Louisa Fay,Lisa M. Koch,Sergios Gatidis,Thomas Küstner,Philipp Berens |
発行日 | 2024-07-29 09:05:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google