Automated Labeling of German Chest X-Ray Radiology Reports using Deep Learning

要約

放射線科医は世界的に不足しており、ディープラーニング モデルは、臨床意思決定支援システムの一部としてこの不足に対処する有望なソリューションを提供します。
ただし、このようなモデルをトレーニングするには、多くの場合、大規模なデータセットに対する高価で時間のかかる手動ラベル付けが必要になります。
放射線レポートからの自動ラベル抽出により、ラベル付きデータセットの取得に必要な時間を短縮できますが、意味的に類似した単語や注釈付きデータの欠落があるため、このタスクは困難です。
この研究では、ルールベースのラベラーを使用して、深層学習ベースのラベル予測モデルの弱い監視の可能性を調査します。
私たちは、ルールベースのドイツ CheXpert モデルによってラベル付けされたレポートで事前トレーニングされ、手動でラベル付けされたレポートの小規模なデータセットで微調整された、深層学習ベースの CheXpert ラベル予測モデルを提案します。
私たちの結果は、3 つのタスクすべてにおいてルールベースのモデルを大幅に上回るアプローチの有効性を示しています。
私たちの調査結果は、データがまばらなシナリオでもディープラーニングベースのモデルを採用し、弱い監視のツールとしてルールベースのラベラーを使用することの利点を強調しています。

要約(オリジナル)

Radiologists are in short supply globally, and deep learning models offer a promising solution to address this shortage as part of clinical decision-support systems. However, training such models often requires expensive and time-consuming manual labeling of large datasets. Automatic label extraction from radiology reports can reduce the time required to obtain labeled datasets, but this task is challenging due to semantically similar words and missing annotated data. In this work, we explore the potential of weak supervision of a deep learning-based label prediction model, using a rule-based labeler. We propose a deep learning-based CheXpert label prediction model, pre-trained on reports labeled by a rule-based German CheXpert model and fine-tuned on a small dataset of manually labeled reports. Our results demonstrate the effectiveness of our approach, which significantly outperformed the rule-based model on all three tasks. Our findings highlight the benefits of employing deep learning-based models even in scenarios with sparse data and the use of the rule-based labeler as a tool for weak supervision.

arxiv情報

著者 Alessandro Wollek,Philip Haitzer,Thomas Sedlmeyr,Sardi Hyska,Johannes Rueckel,Bastian Sabel,Michael Ingrisch,Tobias Lasser
発行日 2023-06-09 16:08:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク