An Inception-Residual-Based Architecture with Multi-Objective Loss for Detecting Respiratory Anomalies

要約

この論文では、呼吸音の録音から異常を検出するために適用される深層学習システムを紹介します。
最初に、システムはガンマトーンと連続ウェーブレット変換を使用した音声特徴抽出から始まります。
このステップは、呼吸音入力を 2 次元スペクトログラムに変換することを目的としています。ここでは、スペクトルと時間の両方の特徴が提示されます。
次に、提案されたシステムは、呼吸異常を分類するために、多頭注意および多目的損失と組み合わせた開始残差ベースのバックボーンモデルを統合します。
この作業では、IEEE BioCAS 2022 チャレンジによって提案された SPRSound (The Open-Source SJTU Pediatric Respiratory Sound) のベンチマーク データセットに対して実験を行いました。
平均スコアとハーモニックスコアの平均で計算されるスコアに関して、提案システムは、タスク 1-1、タスク 1-2、タスク 2-1 で 9.7%、15.8%、17.0%、9.4% と大幅に改善されました。
、タスク 2-2 をチャレンジ ベースライン システムと比較。
特に、タスク 2-1 では最高スコアの 73.7% でトップ 1 のパフォーマンスを達成しました。

要約(オリジナル)

This paper presents a deep learning system applied for detecting anomalies from respiratory sound recordings. Initially, our system begins with audio feature extraction using Gammatone and Continuous Wavelet transformation. This step aims to transform the respiratory sound input into a two-dimensional spectrogram where both spectral and temporal features are presented. Then, our proposed system integrates Inception-residual-based backbone models combined with multi-head attention and multi-objective loss to classify respiratory anomalies. In this work, we conducted experiments over the benchmark dataset of SPRSound (The Open-Source SJTU Paediatric Respiratory Sound) proposed by the IEEE BioCAS 2022 challenge. As regards the Score computed by an average between the average score and harmonic score, our proposed system gained significant improvements of 9.7%, 15.8%, 17.0%, and 9.4% in Task 1-1, Task 1-2, Task 2-1, and Task 2-2 compared to the challenge baseline system. Notably, we achieved the Top-1 performance in Task 2-1 with the highest Score of 73.7%.

arxiv情報

著者 Dat Ngo,Lam Pham,Huy Phan,Minh Tran,Delaram Jarchi,Sefki Kolozali
発行日 2023-03-07 18:10:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS, q-bio.QM パーマリンク