SynthEnsemble: A Fusion of CNN, Vision Transformer, and Hybrid Models for Multi-Label Chest X-Ray Classification

要約

胸部 X 線は胸部疾患の診断に広く使用されていますが、これらの異常に関する詳細な情報が不足しているため、早期発見と効果的な治療に不可欠な正確な自動診断システムの開発が困難になっています。
この課題に対処するために、私たちは深層学習技術を採用して、さまざまな疾患に対応する胸部 X 線写真のパターンを特定しました。
さまざまな事前トレーニング済み CNN、トランスフォーマー、ハイブリッド (CNN + トランスフォーマー) モデル、および古典的モデルを使用して、「ChestX-ray14」データセットで実験を実施しました。
個々のモデルで最も優れていたのは CoAtNet で、84.2% の受信機動作特性曲線下面積 (AUROC) を達成しました。
各モデルの重みが差分進化を使用して決定される加重平均アンサンブルを使用して、すべてのトレーニング済みモデルの予測を組み合わせることで、AUROC がさらに 85.4% に向上し、この分野の他の最先端の方法を上回りました。
私たちの発見は、深層学習技術、特にアンサンブル深層学習が、胸部 X 線写真からの胸部疾患の自動診断の精度を向上させる可能性を示しています。

要約(オリジナル)

Chest X-rays are widely used to diagnose thoracic diseases, but the lack of detailed information about these abnormalities makes it challenging to develop accurate automated diagnosis systems, which is crucial for early detection and effective treatment. To address this challenge, we employed deep learning techniques to identify patterns in chest X-rays that correspond to different diseases. We conducted experiments on the ‘ChestX-ray14’ dataset using various pre-trained CNNs, transformers, hybrid(CNN+Transformer) models and classical models. The best individual model was the CoAtNet, which achieved an area under the receiver operating characteristic curve (AUROC) of 84.2%. By combining the predictions of all trained models using a weighted average ensemble where the weight of each model was determined using differential evolution, we further improved the AUROC to 85.4%, outperforming other state-of-the-art methods in this field. Our findings demonstrate the potential of deep learning techniques, particularly ensemble deep learning, for improving the accuracy of automatic diagnosis of thoracic diseases from chest X-rays.

arxiv情報

著者 S. M. Nabil Ashraf,Md. Adyelullahil Mamun,Hasnat Md. Abdullah,Md. Golam Rabiul Alam
発行日 2023-11-20 15:01:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, I.4 パーマリンク