RadTex: Learning Efficient Radiograph Representations from Text Reports




– ディープラーニングによる胸部放射線写真の自動分析は、患者の疾患の臨床診断を向上させるために非常に有望である。
– 一方で、ディープラーニングモデルは往々にして高い性能を発揮するために大量の注釈付きデータが必要となる。
– 本論文では、放射線科レポートを利用して、限られたラベル付きデータ(1000件以下)でも高い医療画像分類パフォーマンスを達成するためのデータ効率的な学習フレームワークを構築する。
– 具体的には、画像のキャプション事前学習を行い、少ない例でトレーニングされた高品質の医療画像表現を学習する。
– 畳み込みエンコーダーとトランスフォーマーデコーダーの共同事前学習の後、学習されたエンコーダーをさまざまな分類タスクに転移する。
– 9つの病態を平均化した結果、ラベル付きトレーニングデータが限られている場合、当社のモデルは、ImageNetで監視された学習とドメイン内で監視された学習よりも高い分類パフォーマンスを達成すると結論づけた。


Automated analysis of chest radiography using deep learning has tremendous potential to enhance the clinical diagnosis of diseases in patients. However, deep learning models typically require large amounts of annotated data to achieve high performance — often an obstacle to medical domain adaptation. In this paper, we build a data-efficient learning framework that utilizes radiology reports to improve medical image classification performance with limited labeled data (fewer than 1000 examples). Specifically, we examine image-captioning pretraining to learn high-quality medical image representations that train on fewer examples. Following joint pretraining of a convolutional encoder and transformer decoder, we transfer the learned encoder to various classification tasks. Averaged over 9 pathologies, we find that our model achieves higher classification performance than ImageNet-supervised and in-domain supervised pretraining when labeled training data is limited.


著者 Keegan Quigley,Miriam Cha,Ruizhi Liao,Geeticka Chauhan,Steven Horng,Seth Berkowitz,Polina Golland
発行日 2023-04-07 13:50:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク