Chest X-ray Foundation Model with Global and Local Representations Integration

要約

胸部X線(CXR)は最も頻繁に注文された画像検査であり、胸部疾患の検出から術後モニタリングまでの多様な臨床タスクをサポートしています。
ただし、タスク固有の分類モデルは範囲が制限されており、費用のかかるラベル付きデータが必要であり、分散型データセットの一般化が不足しています。
これらの課題に対処するために、堅牢なCXR表現を学習し、幅広いダウンストリームタスクに効果的に一般化する自己監視ビジョンファンデーションモデルであるChexFoundを紹介します。
キュレーションされたCXR-1MデータセットでChexFoundを獲得しました。
下流の適応のためのグローバルおよびローカル表現統合(Glori)モジュールを提案します。これにより、疾患固有のローカル機能をグローバルな画像機能に組み込み、マルチラベル分類におけるパフォーマンスを向上させます。
私たちの実験結果は、ChexFoundがCXR-LT 24データセットの異なる有病率レベルにわたって40の疾患所見を分類する際に最先端のモデルを上回り、限られたトレーニングデータを持つ下流タスクで優れたラベル効率を示すことを示しています。
さらに、ChexFoundは、日和見的な心血管疾患のリスク推定や死亡率予測など、分散型データセットを備えた新しいタスクの大幅な改善を達成しました。
これらの結果は、Chexfoundの強力な一般化機能を強調し、ラベルの効率を改善することで多様な適応を可能にします。
プロジェクトソースコードは、https://github.com/rpidial/chexfoundで公開されています。

要約(オリジナル)

Chest X-ray (CXR) is the most frequently ordered imaging test, supporting diverse clinical tasks from thoracic disease detection to postoperative monitoring. However, task-specific classification models are limited in scope, require costly labeled data, and lack generalizability to out-of-distribution datasets. To address these challenges, we introduce CheXFound, a self-supervised vision foundation model that learns robust CXR representations and generalizes effectively across a wide range of downstream tasks. We pretrain CheXFound on a curated CXR-1M dataset, comprising over one million unique CXRs from publicly available sources. We propose a Global and Local Representations Integration (GLoRI) module for downstream adaptations, by incorporating disease-specific local features with global image features for enhanced performance in multilabel classification. Our experimental results show that CheXFound outperforms state-of-the-art models in classifying 40 disease findings across different prevalence levels on the CXR-LT 24 dataset and exhibits superior label efficiency on downstream tasks with limited training data. Additionally, CheXFound achieved significant improvements on new tasks with out-of-distribution datasets, including opportunistic cardiovascular disease risk estimation and mortality prediction. These results highlight CheXFound’s strong generalization capabilities, enabling diverse adaptations with improved label efficiency. The project source code is publicly available at https://github.com/RPIDIAL/CheXFound.

arxiv情報

著者 Zefan Yang,Xuanang Xu,Jiajin Zhang,Ge Wang,Mannudeep K. Kalra,Pingkun Yan
発行日 2025-02-07 18:16:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク