BoMD: Bag of Multi-label Descriptors for Noisy Chest X-ray Classification

要約

深層学習手法は、医用画像問題において優れた分類精度を示しています。これは主に、きれいなラベルが手動で注釈付けされた大規模なデータセットが利用できることに起因しています。
ただし、このような手動による注釈のコストが高いことを考慮すると、新しい医用画像分類の問題は、放射線医学レポートから抽出された機械生成のノイズの多いラベルに依存する必要がある可能性があります。
実際、多くの胸部 X 線 (CXR) 分類器はすでにノイズのあるラベルを持つデータセットからモデル化されていますが、そのトレーニング手順は一般にノイズのあるラベルのサンプルに対して堅牢ではなく、次善のモデルになります。
さらに、CXR データセットはほとんどがマルチラベルであるため、マルチクラス問題向けに設計された現在のノイズの多いラベル学習方法を簡単に適応させることはできません。
この論文では、ノイズの多いマルチラベル CXR 学習用に設計された新しい方法を提案します。この方法は、データセットからサンプルを検出してスムーズに再ラベル付けし、その後、一般的なマルチラベル分類器のトレーニングに使用されます。
提案された方法は、マルチラベル記述子のバッグ (BoMD) を最適化し、マルチラベル画像アノテーションから BERT モデルによって生成された意味記述子との類似性を促進します。
さまざまなノイズの多いマルチラベル トレーニング セットとクリーンなテスト セットに関する実験では、多くの CXR マルチラベル分類ベンチマークにおいて、モデルが最先端の精度と堅牢性を備えていることがわかりました。

要約(オリジナル)

Deep learning methods have shown outstanding classification accuracy in medical imaging problems, which is largely attributed to the availability of large-scale datasets manually annotated with clean labels. However, given the high cost of such manual annotation, new medical imaging classification problems may need to rely on machine-generated noisy labels extracted from radiology reports. Indeed, many Chest X-ray (CXR) classifiers have already been modelled from datasets with noisy labels, but their training procedure is in general not robust to noisy-label samples, leading to sub-optimal models. Furthermore, CXR datasets are mostly multi-label, so current noisy-label learning methods designed for multi-class problems cannot be easily adapted. In this paper, we propose a new method designed for the noisy multi-label CXR learning, which detects and smoothly re-labels samples from the dataset, which is then used to train common multi-label classifiers. The proposed method optimises a bag of multi-label descriptors (BoMD) to promote their similarity with the semantic descriptors produced by BERT models from the multi-label image annotation. Our experiments on diverse noisy multi-label training sets and clean testing sets show that our model has state-of-the-art accuracy and robustness in many CXR multi-label classification benchmarks.

arxiv情報

著者 Yuanhong Chen,Fengbei Liu,Hu Wang,Chong Wang,Yu Tian,Yuyuan Liu,Gustavo Carneiro
発行日 2023-08-09 08:16:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV パーマリンク