要約
この論文では、診療所で低コストのシステムを使用して、心臓の異常を高精度かつ信頼性で診断するための、迅速かつコスト効率の高い方法を紹介します。
心疾患の自動診断の主な制限は、正確で許容可能な標識サンプルが希少であること、そしてその準備に費用がかかる可能性があることです。
この問題に対処するために、この研究では 2 つの方法が提案されています。
1 つ目の方法は、人間の聴覚処理にヒントを得た独自のマルチブランチ ディープ畳み込みニューラル ネットワーク (MBDCN) アーキテクチャであり、さまざまなサイズの畳み込みフィルターとオーディオ信号パワー スペクトルを入力として使用することで特徴抽出を最適化するように特別に設計されています。
2 番目の方法は、長短期記憶畳み込みニューラル (LSCN) モデルと呼ばれます。さらに、ネットワーク アーキテクチャには、時間領域での特徴抽出を改善するための長短期記憶 (LSTM) ネットワーク ブロックが含まれています。
LSTM ブロックとともに 1 次元畳み込み層で構成される複数の並列ブランチを組み合わせるという革新的なアプローチは、オーディオ信号処理タスクで優れた結果を達成するのに役立ちます。
実験結果は、提案された方法が最先端の技術よりも優れていることを示しています。
LSCN ネットワークによる心音の全体的な分類精度は 96% 以上です。
このネットワークの効率は、メル周波数ケプストラム係数 (MFCC) やウェーブレット変換などの一般的な特徴抽出方法と比較して大幅に優れています。
したがって、提案された方法は心音の自動分析において有望な結果を示し、心血管疾患の診断と早期発見に応用できる可能性があります。
要約(オリジナル)
This paper presents a fast and cost-effective method for diagnosing cardiac abnormalities with high accuracy and reliability using low-cost systems in clinics. The primary limitation of automatic diagnosing of cardiac diseases is the rarity of correct and acceptable labeled samples, which can be expensive to prepare. To address this issue, two methods are proposed in this work. The first method is a unique Multi-Branch Deep Convolutional Neural Network (MBDCN) architecture inspired by human auditory processing, specifically designed to optimize feature extraction by employing various sizes of convolutional filters and audio signal power spectrum as input. In the second method, called as Long short-term memory-Convolutional Neural (LSCN) model, Additionally, the network architecture includes Long Short-Term Memory (LSTM) network blocks to improve feature extraction in the time domain. The innovative approach of combining multiple parallel branches consisting of the one-dimensional convolutional layers along with LSTM blocks helps in achieving superior results in audio signal processing tasks. The experimental results demonstrate superiority of the proposed methods over the state-of-the-art techniques. The overall classification accuracy of heart sounds with the LSCN network is more than 96%. The efficiency of this network is significant compared to common feature extraction methods such as Mel Frequency Cepstral Coefficients (MFCC) and wavelet transform. Therefore, the proposed method shows promising results in the automatic analysis of heart sounds and has potential applications in the diagnosis and early detection of cardiovascular diseases.
arxiv情報
著者 | Seyed Amir Latifi,Hassan Ghassemian,Maryam Imani |
発行日 | 2024-11-21 17:32:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google