要約
この研究では、マルチモーダル、マルチ解剖学的、マルチラベル、ロングテール分類として定式化できる、放射線画像の大規模で語彙の多い疾患分類の問題を調査することを目的としています。
私たちの主な貢献は 3 つあります。(i) データセットの構築において、930 の固有の ICD-10-CM コードに関連付けられた 5568 の疾患を網羅し、39,026 例 (192,675 スキャン) を含む、学術的にアクセス可能な大規模な診断データセットを構築しました。
(ii) モデル設計に関して、豊富なドメイン知識を活用するための知識強化でトレーニングされた、さまざまなイメージングモダリティからの任意の数の入力スキャンの処理を可能にする新しいアーキテクチャを提示します。
(iii) 評価の際、マルチモーダル、多解剖学的ロングテール診断の新しいベンチマークを初期化します。
私たちの方法はそれに関して優れた結果を示しています。
さらに、最終モデルは事前トレーニング済みモデルとして機能し、さまざまな外部データセットでの診断に役立つように微調整できます。
要約(オリジナル)
In this study, we aim to investigate the problem of large-scale, large-vocabulary disease classification for radiologic images, which can be formulated as a multi-modal, multi-anatomy, multi-label, long-tailed classification. Our main contributions are three folds: (i), on dataset construction, we build up an academically accessible, large-scale diagnostic dataset that encompasses 5568 disorders linked with 930 unique ICD-10-CM codes, containing 39,026 cases (192,675 scans). (ii), on model design, we present a novel architecture that enables to process arbitrary number of input scans, from various imaging modalities, which is trained with knowledge enhancement to leverage the rich domain knowledge; (iii), on evaluation, we initialize a new benchmark for multi-modal multi-anatomy long-tailed diagnosis. Our method shows superior results on it. Additionally, our final model serves as a pre-trained model, and can be finetuned to benefit diagnosis on various external datasets.
arxiv情報
著者 | Qiaoyu Zheng,Weike Zhao,Chaoyi Wu,Xiaoman Zhang,Ya Zhang,Yanfeng Wang,Weidi Xie |
発行日 | 2023-12-28 15:26:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google