要約
背景: 医療データのセグメント化、個人健康情報 (PHI) 侵害に関する懸念、およびそのようなセグメント化されたデータの統合と管理にかかる直接的および間接的なコストは、診断機械学習 (DML) 研究者がトレーニングできるプライバシー保護機械学習アルゴリズムを特定する動機となるはずです。
さまざまなモダリティの分散型または分散型データセットに関する。
フェデレーテッド ラーニング モデルは、このような分散型機械学習フレームワークを提供します。このフレームワークでは、異種のデータセットを所有し、さまざまなデバイスやサーバーで作業している複数の研究者が、ローカル データを交換することなくグローバルな機械学習モデルを共同でトレーニングできるため、法定の PHI 保護を満たすことができます。
この目的を達成するために、垂直連合学習モデルが考案され、アルツハイマー病 (AD) の検出における有効性がテストされています。
方法: Open Access Series of Imaging Studies の第 2 バージョン (人口統計、画像、臨床評価のデータセットが多数含まれている) を使用して、アルツハイマー病検出のためのマルチモーダル垂直連合学習 (VFL) モデルをテストしました。
結果: OASIS-2 の人口統計データ、臨床データ、および MRI データに基づいてこの VFL モデルをトレーニングおよび検証することにより、以前に報告された結果と一致して、82.9% の精度が達成されました。
結論: ここで提案する VFL アーキテクチャは、法的なプライバシー制約を尊重しながら、医療データの多様なソースにわたる共同学習を可能にする、新しい分散アーキテクチャを提供します。
データの複数のモダリティを活用することで、AD 検出の堅牢性と精度を強化できます。
このモデルは、連合学習技術の進歩に貢献するだけでなく、医学研究におけるデータのセグメント化によってもたらされるハードルを克服することも期待されています。
要約(オリジナル)
BACKGROUND: Segmentation of medical data, concerns about personal health information (PHI) breaches, and the direct and indirect costs of consolidating and managing such segmented date should motivate diagnostic machine learning (DML) researchers to identify privacy-preserving machine learning algorithms that can train on distributed or decentralized datasets of different modalities. Federated learning models provide such a decentralized machine learning framework in which multiple investigators in possession of disparate datasets and working on different devices or servers can train collaboratively a global machine learning models without ever having to exchange local data and thus can meet statutory PHI protections. To this end, a vertical federate learning model is devised and tested for efficacy in the detection of Alzheimer’s Disease (AD). METHODS: The second version of Open Access Series of Imaging Studies — with its panoply of demographic, imaging, and clinical assessment datasets — was used to test a multimodal vertical federated learning (VFL) model for AD detection. RESULTS: By training and validating this VFL model on the demographic, clinical, and MRI data in OASIS-2, an 82.9\% accuracy rate is achieved, consistent with previously reported results. CONCLUSIONS: The VFL architecture proposed herein offers a novel distributed architecture, enabling collaborative learning across diverse sources of medical data while respecting statutory privacy constraints. By leveraging multiple modalities of data, the robustness and accuracy of AD detection can be enhanced. This model not only contributes to the advancement of federated learning techniques but also holds promise for overcoming the hurdles posed by data segmentation in medical research.
arxiv情報
著者 | Paul K. Mandal |
発行日 | 2024-08-15 17:10:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google