Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise

要約

教師あり深層学習ベースの医用画像分類の堅牢性は、ラベル ノイズによって大幅に損なわれます。
ノイズのあるラベルが存在する場合の分類パフォーマンスを向上させるためにいくつかの方法が提案されていますが、それらはいくつかの課題に直面しています。1) クラスの不均衡なデータセットとの闘い。これにより、少数クラスがノイズのあるサンプルとして頻繁に見落とされます。
2) ノイズの多いラベルを積極的にクリーニングするための専門家を組み込むことなく、ノイズの多いデータセットを使用してパフォーマンスを最大化することに重点を置いています。
これらの課題を軽減するために、ノイズのあるラベルによる学習 (LNL) とアクティブ ラーニングを組み合わせた 2 段階のアプローチを提案します。
このアプローチは、ノイズの多いラベルが存在する場合の医用画像分類の堅牢性を向上させるだけでなく、限られたアノテーション予算の下で、重要で間違ったラベルを再ラベルすることにより、データセットの品質を反復的に向上させます。
さらに、LNL フェーズで新しい勾配分散アプローチを導入します。これは、過小評価されたサンプルもサンプリングすることで、損失ベースのサンプル選択を補完します。
2 つの不均衡なノイズの多い医療分類データセットを使用して、少数クラスのクリーンなサンプルを大部分がノイズの多いサンプルとして誤認しないことにより、クラスの不均衡を処理する点で、私たちが提案する手法が以前の手法よりも優れていることを示します。

要約(オリジナル)

The robustness of supervised deep learning-based medical image classification is significantly undermined by label noise. Although several methods have been proposed to enhance classification performance in the presence of noisy labels, they face some challenges: 1) a struggle with class-imbalanced datasets, leading to the frequent overlooking of minority classes as noisy samples; 2) a singular focus on maximizing performance using noisy datasets, without incorporating experts-in-the-loop for actively cleaning the noisy labels. To mitigate these challenges, we propose a two-phase approach that combines Learning with Noisy Labels (LNL) and active learning. This approach not only improves the robustness of medical image classification in the presence of noisy labels, but also iteratively improves the quality of the dataset by relabeling the important incorrect labels, under a limited annotation budget. Furthermore, we introduce a novel Variance of Gradients approach in LNL phase, which complements the loss-based sample selection by also sampling under-represented samples. Using two imbalanced noisy medical classification datasets, we demonstrate that that our proposed technique is superior to its predecessors at handling class imbalance by not misidentifying clean samples from minority classes as mostly noisy samples.

arxiv情報

著者 Bidur Khanal,Tianhong Dai,Binod Bhattarai,Cristian Linte
発行日 2024-07-08 14:16:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク