Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers

要約

近年のディープラーニング技術の進歩により、マルチモーダルな医療データに基づく疾病診断など、様々な実世界アプリケーションで性能向上の火付け役となっている。咳音データに基づく呼吸器疾患(COVID-19や慢性閉塞性肺疾患など)診断も注目を集めている。しかし、既存の研究は通常、伝統的な機械学習や中程度のスケールのディープモデルを利用している。一方、開発されたアプローチは、臨床データのキュレーションとアノテーションがスケール的に困難であるため、小規模なデータで学習・評価されている。先行研究におけるこれらの問題に対処するため、我々は、軽量な畳み込みニューラルネットワーク(例えば、ResNet18)から最新の視覚変換器まで、様々な深層モデルを評価するための統一されたフレームワークを作成し、呼吸器疾患分類における性能を比較する。このような広範な実証的研究から得られた知見に基づき、大規模な咳データセットにおける自己教師あり学習と教師あり学習の両方に基づく、咳に基づく疾患分類への新たなアプローチを提案する。実験結果は、COVID-19診断のための2つのベンチマークデータセットと、COPD/非COPD分類のための独自のデータセットにおいて、我々の提案するアプローチが、92.5%のAUROCで一貫して先行技術を上回ることを実証している。

要約(オリジナル)

Recent advancements in deep learning techniques have sparked performance boosts in various real-world applications including disease diagnosis based on multi-modal medical data. Cough sound data-based respiratory disease (e.g., COVID-19 and Chronic Obstructive Pulmonary Disease) diagnosis has also attracted much attention. However, existing works usually utilise traditional machine learning or deep models of moderate scales. On the other hand, the developed approaches are trained and evaluated on small-scale data due to the difficulty of curating and annotating clinical data on scale. To address these issues in prior works, we create a unified framework to evaluate various deep models from lightweight Convolutional Neural Networks (e.g., ResNet18) to modern vision transformers and compare their performance in respiratory disease classification. Based on the observations from such an extensive empirical study, we propose a novel approach to cough-based disease classification based on both self-supervised and supervised learning on a large-scale cough data set. Experimental results demonstrate our proposed approach outperforms prior arts consistently on two benchmark datasets for COVID-19 diagnosis and a proprietary dataset for COPD/non-COPD classification with an AUROC of 92.5%.

arxiv情報

著者 Qian Wang,Zhaoyang Bu,Jiaxuan Mao,Wenyu Zhu,Jingya Zhao,Wei Du,Guochao Shi,Min Zhou,Si Chen,Jieming Qu
発行日 2024-09-03 03:22:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS パーマリンク