An Inception-Residual-Based Architecture with Multi-Objective Loss for Detecting Respiratory Anomalies


このステップは、呼吸音入力を 2 次元スペクトログラムに変換することを目的としています。ここでは、スペクトルと時間の両方の特徴が提示されます。
この作業では、IEEE BioCAS 2022 チャレンジによって提案された SPRSound (The Open-Source SJTU Pediatric Respiratory Sound) のベンチマーク データセットに対して実験を行いました。
平均スコアとハーモニックスコアの平均で計算されるスコアに関して、提案システムは、タスク 1-1、タスク 1-2、タスク 2-1 で 9.7%、15.8%、17.0%、9.4% と大幅に改善されました。
、タスク 2-2 をチャレンジ ベースライン システムと比較。
特に、タスク 2-1 では最高スコアの 73.7% でトップ 1 のパフォーマンスを達成しました。


This paper presents a deep learning system applied for detecting anomalies from respiratory sound recordings. Initially, our system begins with audio feature extraction using Gammatone and Continuous Wavelet transformation. This step aims to transform the respiratory sound input into a two-dimensional spectrogram where both spectral and temporal features are presented. Then, our proposed system integrates Inception-residual-based backbone models combined with multi-head attention and multi-objective loss to classify respiratory anomalies. In this work, we conducted experiments over the benchmark dataset of SPRSound (The Open-Source SJTU Paediatric Respiratory Sound) proposed by the IEEE BioCAS 2022 challenge. As regards the Score computed by an average between the average score and harmonic score, our proposed system gained significant improvements of 9.7%, 15.8%, 17.0%, and 9.4% in Task 1-1, Task 1-2, Task 2-1, and Task 2-2 compared to the challenge baseline system. Notably, we achieved the Top-1 performance in Task 2-1 with the highest Score of 73.7%.


著者 Dat Ngo,Lam Pham,Huy Phan,Minh Tran,Delaram Jarchi,Sefki Kolozali
発行日 2023-03-07 18:10:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.SD, eess.AS, q-bio.QM パーマリンク