BarlowTwins-CXR : Enhancing Chest X-Ray abnormality localization in heterogeneous data with cross-domain self-supervised learning

要約

背景: 胸部 X 線画像に基づく異常位置特定は、さまざまな病気の診断に不可欠ですが、複雑な解釈と放射線科医の仕事量の増加により、重大な臨床課題に直面しています。
深層学習の最近の進歩は有望な解決策を提供しますが、クロスドメイン転移学習にはドメインの不整合という重大な問題が依然としてあり、診断プロセスの効率と精度を妨げます。
この研究は、「BarlwoTwins-CXR」と呼ばれる自己教師あり学習戦略を開発することにより、ドメイン不一致の問題に対処し、異種胸部X線画像解析の自律神経異常位置特定パフォーマンスを向上させることを目的としています。
方法: NIH 胸部 X 線データセットと VinDr-CXR という 2 つの公的に利用可能なデータセットを利用しました。
BarlowTwins-CXR アプローチは 2 段階のトレーニング プロセスで実施されました。
最初に、自己教師あり事前トレーニングは、ImageNet で事前トレーニングされた Resnet50 バックボーンを備えた NIH データセット上で調整された Barlow Twins アルゴリズムを使用して実行されました。
続いて、Fature Pyramid Network (FPN) を備えた Faster R-CNN を使用して、VinDr-CXR データセットに対する教師付き微調整が行われました。
結果: 私たちの実験では、BarlowTwins-CXR を使用したモデルのパフォーマンスが大幅に向上したことがわかりました。
このアプローチでは、従来の ImageNet 事前トレーニング済みモデルと比較して、mAP50 の精度が 3% 向上しました。
さらに、Ablation CAM 法により、胸部異常の位置を特定する精度が向上したことが明らかになりました。
結論: BarlowTwins-CXR は、胸部 X 線画像に基づく異常位置特定の効率と精度を大幅に向上させ、従来の転移学習法を上回り、クロスドメイン シナリオにおけるドメインの不一致を効果的に克服します。
私たちの実験結果は、限られた量の異種データを使用する医療現場で、自己教師あり学習を使用してモデルの一般化可能性を向上させる可能性を示しています。

要約(オリジナル)

Background: Chest X-ray imaging-based abnormality localization, essential in diagnosing various diseases, faces significant clinical challenges due to complex interpretations and the growing workload of radiologists. While recent advances in deep learning offer promising solutions, there is still a critical issue of domain inconsistency in cross-domain transfer learning, which hampers the efficiency and accuracy of diagnostic processes. This study aims to address the domain inconsistency problem and improve autonomic abnormality localization performance of heterogeneous chest X-ray image analysis, by developing a self-supervised learning strategy called ‘BarlwoTwins-CXR’. Methods: We utilized two publicly available datasets: the NIH Chest X-ray Dataset and the VinDr-CXR. The BarlowTwins-CXR approach was conducted in a two-stage training process. Initially, self-supervised pre-training was performed using an adjusted Barlow Twins algorithm on the NIH dataset with a Resnet50 backbone pre-trained on ImageNet. This was followed by supervised fine-tuning on the VinDr-CXR dataset using Faster R-CNN with Feature Pyramid Network (FPN). Results: Our experiments showed a significant improvement in model performance with BarlowTwins-CXR. The approach achieved a 3% increase in mAP50 accuracy compared to traditional ImageNet pre-trained models. In addition, the Ablation CAM method revealed enhanced precision in localizing chest abnormalities. Conclusion: BarlowTwins-CXR significantly enhances the efficiency and accuracy of chest X-ray image-based abnormality localization, outperforming traditional transfer learning methods and effectively overcoming domain inconsistency in cross-domain scenarios. Our experiment results demonstrate the potential of using self-supervised learning to improve the generalizability of models in medical settings with limited amounts of heterogeneous data.

arxiv情報

著者 Haoyue Sheng,Linrui Ma,Jean-Francois Samson,Dianbo Liu
発行日 2024-02-09 16:10:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, I.2.1 パーマリンク