Informed Deep Abstaining Classifier: Investigating noise-robust training for diagnostic decision support systems

要約

深層学習を利用した画像ベースの診断意思決定支援システム (DDSS) には、臨床ワークフローを最適化する可能性があります。
ただし、DDSS の開発には専門家の注釈が付けられた大規模なデータセットが必要なため、コストがかかります。
自然言語処理を使用して放射線データベースのレポート コンテンツを利用して、対応する画像データに注釈を付けることで、労力のかかる手動の注釈を置き換えることが期待できます。
「現実世界」データベースのマイニングではラベル ノイズが発生する可能性があるため、ノイズに強いトレーニング損失は非常に興味深いものです。
ただし、現在のノイズ耐性損失には、たとえば使用される自動ラベル生成器のパフォーマンスに基づいて導出できるノイズ推定が考慮されていません。
この研究では、トレーニング中にノイズ レベル推定を組み込むことで、ノイズに強い Deep Abstaining Classifier (DAC) 損失を Informed Deep Abstaining Classifier (IDAC) 損失に拡張します。
私たちの調査結果は、IDAC が DAC やいくつかの最先端の損失関数と比較してノイズ耐性を強化していることを示しています。
結果は、公開胸部 X 線データ セットを使用して、さまざまなシミュレートされたノイズ レベルで得られます。
これらの発見は、ラベルがテキストベースのトランスフォーマーによってボン大学病院の臨床システムから抽出された社内のノイズの多いデータセット上で再現されます。
したがって、IDAC は、日常的な臨床データから正確で信頼性の高い DDSS を開発することを目指す研究者、企業、または診療所にとって貴重なツールとなり得ます。

要約(オリジナル)

Image-based diagnostic decision support systems (DDSS) utilizing deep learning have the potential to optimize clinical workflows. However, developing DDSS requires extensive datasets with expert annotations and is therefore costly. Leveraging report contents from radiological data bases with Natural Language Processing to annotate the corresponding image data promises to replace labor-intensive manual annotation. As mining ‘real world’ databases can introduce label noise, noise-robust training losses are of great interest. However, current noise-robust losses do not consider noise estimations that can for example be derived based on the performance of the automatic label generator used. In this study, we expand the noise-robust Deep Abstaining Classifier (DAC) loss to an Informed Deep Abstaining Classifier (IDAC) loss by incorporating noise level estimations during training. Our findings demonstrate that IDAC enhances the noise robustness compared to DAC and several state-of-the-art loss functions. The results are obtained on various simulated noise levels using a public chest X-ray data set. These findings are reproduced on an in-house noisy data set, where labels were extracted from the clinical systems of the University Hospital Bonn by a text-based transformer. The IDAC can therefore be a valuable tool for researchers, companies or clinics aiming to develop accurate and reliable DDSS from routine clinical data.

arxiv情報

著者 Helen Schneider,Sebastian Nowak,Aditya Parikh,Yannik C. Layer,Maike Theis,Wolfgang Block,Alois M. Sprinkart,Ulrike Attenberger,Rafet Sifa
発行日 2024-10-28 13:36:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク