要約
医療画像の分類は、ラベル付きサンプルの不足と、病気の有病率の大きなばらつきによって引き起こされるクラスの不均衡により、困難な作業です。
半教師あり学習 (SSL) 手法では、ラベル付きデータとラベルなしデータの両方を活用することで、これらの課題を軽減できます。
ただし、医用画像分類用の SSL 手法では、(1) ラベルのないデータセット内の画像の信頼できる擬似ラベルを推定すること、および (2) クラスの不均衡によって引き起こされるバイアスを軽減することという 2 つの重要な課題に対処する必要があります。
このペーパーでは、これらの課題に効果的に対処する新しい SSL アプローチである SPLAL を提案します。
SPLAL は、クラス プロトタイプと分類子の重み付けの組み合わせを利用して、ラベルのない画像のサブセットに対して信頼できる疑似ラベルを予測します。
さらに、多数派クラスに対するモデルのバイアスを軽減するためにアライメント損失を導入します。
提案したアプローチのパフォーマンスを評価するために、皮膚病変分類 (ISIC 2018) と血球分類データセット (BCCD) という 2 つの公的に利用可能な医療画像分類ベンチマーク データセットで実験を実施します。
実験結果は、私たちのアプローチがさまざまな評価基準においていくつかの最先端の SSL メソッドよりも優れていることを経験的に示しています。
具体的には、私たちが提案したアプローチは、精度と F1 スコアの両方において、ISIC 2018 データセットに対する最先端のアプローチと比べて大幅な改善を達成し、相対マージンはそれぞれ 2.24\% と 11.40\% でした。
最後に、私たちは広範なアブレーション実験を実施して、アプローチのさまざまなコンポーネントの寄与を調べ、その有効性を検証します。
要約(オリジナル)
Medical image classification is a challenging task due to the scarcity of labeled samples and class imbalance caused by the high variance in disease prevalence. Semi-supervised learning (SSL) methods can mitigate these challenges by leveraging both labeled and unlabeled data. However, SSL methods for medical image classification need to address two key challenges: (1) estimating reliable pseudo-labels for the images in the unlabeled dataset and (2) reducing biases caused by class imbalance. In this paper, we propose a novel SSL approach, SPLAL, that effectively addresses these challenges. SPLAL leverages class prototypes and a weighted combination of classifiers to predict reliable pseudo-labels over a subset of unlabeled images. Additionally, we introduce alignment loss to mitigate model biases toward majority classes. To evaluate the performance of our proposed approach, we conduct experiments on two publicly available medical image classification benchmark datasets: the skin lesion classification (ISIC 2018) and the blood cell classification dataset (BCCD). The experimental results empirically demonstrate that our approach outperforms several state-of-the-art SSL methods over various evaluation metrics. Specifically, our proposed approach achieves a significant improvement over the state-of-the-art approach on the ISIC 2018 dataset in both Accuracy and F1 score, with relative margins of 2.24\% and 11.40\%, respectively. Finally, we conduct extensive ablation experiments to examine the contribution of different components of our approach, validating its effectiveness.
arxiv情報
著者 | Md Junaid Mahmood,Pranaw Raj,Divyansh Agarwal,Suruchi Kumari,Pravendra Singh |
発行日 | 2023-07-10 14:53:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google