Developing a Multi-variate Prediction Model For COVID-19 From Crowd-sourced Respiratory Voice Data

要約

新型コロナウイルス感染症は世界 223 か国以上に影響を及ぼしており、ポストコロナ時代には、新型コロナウイルス感染症を検出するための非侵襲性、低コスト、拡張性の高いソリューションが急務となっています。
音声録音データから新型コロナウイルス感染症を識別するディープラーニングモデルを開発します。
この研究の新規性は、音声録音のみから新型コロナウイルス感染症を識別するための深層学習モデルの開発にあります。
私たちは、COVID-19 サウンド アプリを介して 4,352 人の参加者からクラウドソーシングされた 893 個の音声サンプルを含む、ケンブリッジの COVID-19 サウンド データベースを使用しています。
メル スペクトログラムとメル周波数ケプストラム係数 (MFCC) を含む音声特徴と CNN エンコーダー特徴が抽出されます。
音声データに基づいて、新型コロナウイルス感染症の症例を検出するためのディープラーニング分類モデルを開発します。
これらのモデルには、Long Short-Term Memory (LSTM)、畳み込みニューラル ネットワーク (CNN)、Hidden-Unit BERT (HuBERT) が含まれます。
その予測力をベースラインの機械学習モデルと比較します。
HuBERT は、86% という最高の精度と 0.93 という最高の AUC を達成します。
提案されたモデルで得られた結果は、最先端技術から得られた結果と比較した場合、音声録音からの COVID-19 診断において有望な結果が得られることを示唆しています。

要約(オリジナル)

COVID-19 has affected more than 223 countries worldwide and in the Post-COVID Era, there is a pressing need for non-invasive, low-cost, and highly scalable solutions to detect COVID-19. We develop a deep learning model to identify COVID-19 from voice recording data. The novelty of this work is in the development of deep learning models for COVID-19 identification from only voice recordings. We use the Cambridge COVID-19 Sound database which contains 893 speech samples, crowd-sourced from 4352 participants via a COVID-19 Sounds app. Voice features including Mel-spectrograms and Mel-frequency cepstral coefficients (MFCC) and CNN Encoder features are extracted. Based on the voice data, we develop deep learning classification models to detect COVID-19 cases. These models include Long Short-Term Memory (LSTM) and Convolutional Neural Network (CNN) and Hidden-Unit BERT (HuBERT). We compare their predictive power to baseline machine learning models. HuBERT achieves the highest accuracy of 86\% and the highest AUC of 0.93. The results achieved with the proposed models suggest promising results in COVID-19 diagnosis from voice recordings when compared to the results obtained from the state-of-the-art.

arxiv情報

著者 Yuyang Yan,Wafaa Aljbawi,Sami O. Simons,Visara Urovi
発行日 2024-02-12 12:52:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク