要約
ディープラーニングはコンピューター支援診断の最先端技術となっているため、臨床導入には自動決定の解釈可能性が非常に重要です。
この分野ではさまざまな方法が提案されていますが、放射線スクリーニング中の臨床医の視覚的注意マップは、重要な洞察を提供する独自の資産を提供し、コンピューター支援診断の質を向上させる可能性があります。
この論文では、関節疾患の診断と胸部 X 線スキャンの対応する視覚的顕著性マップの予測のための新しい深層学習フレームワークを紹介します。
具体的には、新しいデュアル エンコーダ マルチタスク UNet を設計しました。これは、DenseNet201 バックボーンと、残差およびスクイーズアンド励起ブロックベースのエンコーダの両方を活用して、顕著性マップ予測のための多様な特徴を抽出し、マルチスケールの特徴融合を行います。
病気の分類を行う分類器。
マルチタスク学習における個々のタスクの非同期トレーニング スケジュールの問題に取り組むために、パフォーマンスを向上させるために特徴エンコーダーの事前トレーニングに対照学習を使用した多段階の協調学習戦略を提案しました。
実験により、私たちの提案した方法が胸部X線診断および視覚的顕著性マップ予測の品質に関する既存の技術を上回っていることが示されています。
要約(オリジナル)
As deep learning has become the state-of-the-art for computer-assisted diagnosis, interpretability of the automatic decisions is crucial for clinical deployment. While various methods were proposed in this domain, visual attention maps of clinicians during radiological screening offer a unique asset to provide important insights and can potentially enhance the quality of computer-assisted diagnosis. With this paper, we introduce a novel deep-learning framework for joint disease diagnosis and prediction of corresponding visual saliency maps for chest X-ray scans. Specifically, we designed a novel dual-encoder multi-task UNet, which leverages both a DenseNet201 backbone and a Residual and Squeeze-and-Excitation block-based encoder to extract diverse features for saliency map prediction, and a multi-scale feature-fusion classifier to perform disease classification. To tackle the issue of asynchronous training schedules of individual tasks in multi-task learning, we proposed a multi-stage cooperative learning strategy, with contrastive learning for feature encoder pretraining to boost performance. Experiments show that our proposed method outperformed existing techniques for chest X-ray diagnosis and the quality of visual saliency map prediction.
arxiv情報
著者 | Zirui Qiu,Hassan Rivaz,Yiming Xiao |
発行日 | 2024-03-29 16:14:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google