The Importance of Background Information for Out of Distribution Generalization

要約

医用画像分類におけるドメインの一般化は、信頼できる機械学習を医療に導入するための重要な問題です。
特徴の帰属を制御するためにグラウンドトゥルース異常セグメンテーションを利用するドメイン一般化の既存のアプローチは、経験的リスク最小化(ERM)の標準ベースラインと比較して配布外(OOD)パフォーマンスが低いことがわかります。
画像のどの領域が医用画像の分類に重要であるかを調査し、異常セグメンテーションに含まれていない背景の部分が有用な信号を提供することを示します。
次に、関連するすべての領域をカバーする新しいタスク固有のマスクを開発します。
この新しいセグメンテーションマスクを利用すると、OODテストセットの既存のメソッドのパフォーマンスが大幅に向上します。
ERMよりも優れた一般化結果を得るには、これらのタスク固有のマスクの使用に加えて、トレーニングデータサイズをスケールアップする必要があることがわかります。

要約(オリジナル)

Domain generalization in medical image classification is an important problem for trustworthy machine learning to be deployed in healthcare. We find that existing approaches for domain generalization which utilize ground-truth abnormality segmentations to control feature attributions have poor out-of-distribution (OOD) performance relative to the standard baseline of empirical risk minimization (ERM). We investigate what regions of an image are important for medical image classification and show that parts of the background, that which is not contained in the abnormality segmentation, provides helpful signal. We then develop a new task-specific mask which covers all relevant regions. Utilizing this new segmentation mask significantly improves the performance of the existing methods on the OOD test sets. To obtain better generalization results than ERM, we find it necessary to scale up the training data size in addition to the usage of these task-specific masks.

arxiv情報

著者 Jupinder Parmar,Khaled Saab,Brian Pogatchnik,Daniel Rubin,Christopher Ré
発行日 2022-06-17 14:12:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク