Application of federated learning techniques for arrhythmia classification using 12-lead ECG signals

要約

厳選された大規模な医療データセットの人工知能ベース (AI) 分析は、低電力心電図 (ECG) モニタリング デバイスの情報を使用して、早期発見、迅速な診断、より効果的な治療を提供することが期待されています。
ただし、不適切な使用、安全でない保管、データ漏洩は個人のプライバシーを侵害する可能性があるため、さまざまなソースからの機密医療データへのアクセスは厳しく制限されています。
この研究では、Federated Learning (FL) プライバシー保護手法を使用して、6 つの異種ソースから収集された 12 リード センサー アレイからの高解像度 ECG の異種セット上で AI モデルをトレーニングします。
私たちは、集中学習 (CL) 方式でトレーニングされた最先端のモデルと比較して、結果として得られたモデルが同等のパフォーマンスを達成する能力を評価しました。
さらに、独立同一分散 (IID) および非 IID フェデレーテッド データに対するソリューションのパフォーマンスを評価しました。
私たちの方法論には、ディープ ニューラル ネットワークと長期短期記憶モデルに基づく機械学習技術が含まれます。
特徴量エンジニアリング、選択、データ バランシング技術を備えた堅牢なデータ前処理パイプラインを備えています。
当社の AI モデルは、CL、IID、および非 IID アプローチを使用してトレーニングされたモデルと同等のパフォーマンスを実証しました。
これらは、複雑さの軽減とトレーニング時間の短縮という利点を示し、クラウド エッジ アーキテクチャに最適であることを示しました。

要約(オリジナル)

Artificial Intelligence-based (AI) analysis of large, curated medical datasets is promising for providing early detection, faster diagnosis, and more effective treatment using low-power Electrocardiography (ECG) monitoring devices information. However, accessing sensitive medical data from diverse sources is highly restricted since improper use, unsafe storage, or data leakage could violate a person’s privacy. This work uses a Federated Learning (FL) privacy-preserving methodology to train AI models over heterogeneous sets of high-definition ECG from 12-lead sensor arrays collected from six heterogeneous sources. We evaluated the capacity of the resulting models to achieve equivalent performance compared to state-of-the-art models trained in a Centralized Learning (CL) fashion. Moreover, we assessed the performance of our solution over Independent and Identical distributed (IID) and non-IID federated data. Our methodology involves machine learning techniques based on Deep Neural Networks and Long-Short-Term Memory models. It has a robust data preprocessing pipeline with feature engineering, selection, and data balancing techniques. Our AI models demonstrated comparable performance to models trained using CL, IID, and non-IID approaches. They showcased advantages in reduced complexity and faster training time, making them well-suited for cloud-edge architectures.

arxiv情報

著者 Daniel Mauricio Jimenez Gutierrez,Hafiz Muuhammad Hassan,Lorella Landi,Andrea Vitaletti,Ioannis Chatzigiannakis
発行日 2024-01-05 16:32:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク