Weakly Supervised Learning with Automated Labels from Radiology Reports for Glioma Change Detection

要約

神経膠腫は、成人で最も頻繁に発生する原発性脳腫瘍です。
神経膠腫の変化検出は、時間の経過とともに変化する画像の関連部分を見つけることを目的としています。
ディープ ラーニング (DL) は、同様の変化検出タスクで有望なパフォーマンスを示していますが、注釈付きの大規模なデータセットの作成は、放射線学における教師あり DL アプリケーションの主要なボトルネックとなっています。
これを克服するために、弱いラベル (不正確ですが、作成が高速な注釈) と転移学習 (TL) を組み合わせて使用​​することを提案します。
具体的には、ソース ドメインとターゲット ドメインが同一である誘導 TL を調査しますが、ラベル シフトによりタスクが異なります。ターゲット ラベルは 3 人の放射線科医によって手動で作成されますが、ソース ウィーク ラベルは NLP を介して放射線レポートから自動的に生成されます。
知識の伝達をハイパーパラメーターの最適化としてフレーム化し、関連する作業で頻繁に行われるヒューリスティックな選択を回避します。
低容量の VGG と高容量の ResNeXt モデルを比較して、モデル サイズと TL の関係を調べます。
183 人の患者から作成された 1693 の T2 強調磁気共鳴イメージング差分マップでモデルを評価し、腫瘍の進化に従って患者を安定または不安定に分類します。
放射線レポートから抽出された弱いラベルにより、データセットのサイズを 3 倍以上に拡大し、VGG 分類結果を 75% から 82% AUC に改善することができました。
ゼロからの混合トレーニングにより、微調整や特徴抽出よりも高いパフォーマンスが得られました。
一般化可能性を評価するために、オープン データセット (BraTS-2015: 15 人の患者、51 の差分マップ) で推論を実行し、最大 76% の AUC に達しました。
全体として、結果は、医用画像の問題は、コンピューター ビジョン データセットに関して、より小さなモデルとさまざまな TL 戦略の恩恵を受ける可能性があること、およびレポートで生成された弱いラベルがモデルのパフォーマンスを向上させるのに効果的であることを示唆しています。
コード、社内データセット、BraTS ラベルを公開。

要約(オリジナル)

Gliomas are the most frequent primary brain tumors in adults. Glioma change detection aims at finding the relevant parts of the image that change over time. Although Deep Learning (DL) shows promising performances in similar change detection tasks, the creation of large annotated datasets represents a major bottleneck for supervised DL applications in radiology. To overcome this, we propose a combined use of weak labels (imprecise, but fast-to-create annotations) and Transfer Learning (TL). Specifically, we explore inductive TL, where source and target domains are identical, but tasks are different due to a label shift: our target labels are created manually by three radiologists, whereas our source weak labels are generated automatically from radiology reports via NLP. We frame knowledge transfer as hyperparameter optimization, thus avoiding heuristic choices that are frequent in related works. We investigate the relationship between model size and TL, comparing a low-capacity VGG with a higher-capacity ResNeXt model. We evaluate our models on 1693 T2-weighted magnetic resonance imaging difference maps created from 183 patients, by classifying them into stable or unstable according to tumor evolution. The weak labels extracted from radiology reports allowed us to increase dataset size more than 3-fold, and improve VGG classification results from 75% to 82% AUC. Mixed training from scratch led to higher performance than fine-tuning or feature extraction. To assess generalizability, we ran inference on an open dataset (BraTS-2015: 15 patients, 51 difference maps), reaching up to 76% AUC. Overall, results suggest that medical imaging problems may benefit from smaller models and different TL strategies with respect to computer vision datasets, and that report-generated weak labels are effective in improving model performances. Code, in-house dataset and BraTS labels are released.

arxiv情報

著者 Tommaso Di Noto,Meritxell Bach Cuadra,Chirine Atat,Eduardo Gamito Teiga,Monika Hegi,Andreas Hottinger,Patric Hagmann,Jonas Richiardi
発行日 2023-01-26 16:07:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク