Pseudo Bias-Balanced Learning for Debiased Chest X-ray Classification

要約

ディープラーニングモデルは、データセットバイアスのようなショートカットから学習することが頻繁に報告されていました。現代の医療システムにおいてディープラーニングが果たす役割はますます大きくなっており、医療データにおけるショートカット学習に対抗するとともに、バイアスのない信頼できるモデルを開発することは大きなニーズである。本論文では、バイアスのラベルを正確に知らないまま、バイアスのかかった学習データからバイアスのかかった胸部X線診断モデルを開発する問題について研究する。我々は,バイアス分布のアンバランスが近道学習を引き起こす重要な理由の一つであり,データセットのバイアスは意図した特徴よりも学習しやすければモデルによって好まれるという観察から出発する.これらの考察に基づき、我々は、まず一般化クロスエントロピー損失によりサンプル毎のバイアスラベルを捕捉・予測し、次に疑似バイアスラベルとバイアスバランスソフトマックス関数を用いてデビアスモデルを学習する、新しいアルゴリズム「疑似バイアスバランス学習」を提案した。我々は、様々なバイアス状況を持つ胸部X線データセットを構築し、我々の提案する手法が他の最先端アプローチと比較して一貫した改善を達成することを広範な実験により実証した。

要約(オリジナル)

Deep learning models were frequently reported to learn from shortcuts like dataset biases. As deep learning is playing an increasingly important role in the modern healthcare system, it is of great need to combat shortcut learning in medical data as well as develop unbiased and trustworthy models. In this paper, we study the problem of developing debiased chest X-ray diagnosis models from the biased training data without knowing exactly the bias labels. We start with the observations that the imbalance of bias distribution is one of the key reasons causing shortcut learning, and the dataset biases are preferred by the model if they were easier to be learned than the intended features. Based on these observations, we proposed a novel algorithm, pseudo bias-balanced learning, which first captures and predicts per-sample bias labels via generalized cross entropy loss and then trains a debiased model using pseudo bias labels and bias-balanced softmax function. We constructed several chest X-ray datasets with various dataset bias situations and demonstrated with extensive experiments that our proposed method achieved consistent improvements over other state-of-the-art approaches.

arxiv情報

著者 Luyang Luo,Dunyuan Xu,Hao Chen,Tien-Tsin Wong,Pheng-Ann Heng
発行日 2022-08-04 17:39:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク