要約
EHRの採用により、臨床ケアと研究におけるデータ駆動型アルゴリズムを活用する機会が拡大しました。
多施設のEHR研究を効果的に実施する主要なボトルネックは、システム全体のデータの不均一性であり、機関全体で存在しないか、異なる臨床概念を表している多数のコードを備えています。
データプライバシーの必要性は、患者サブグループ間の類似性と相違点を研究するために必要な多施設患者レベルのデータを含めることの実現可能性をさらに制限します。
これらの課題に対処するために、ゲームアルゴリズムを開発しました。
7つの機関と2つの言語でテストおよび検証されたゲームは、いくつかのレベルでデータを統合します。(1)コードと既存の知識ソースとの関係を確立するための知識グラフで機関レベルで、標準コードの医療コンテキストと互いの関係を提供します
;
(2)機関間で、言語モデルを活用して、確立された標準コードと機関固有のコード間の関係を決定する。
(3)グラフ注意ネットワークを使用したコード間の関係の強度を定量化する。
共同トレーニングされた埋め込みは、データプライバシーを維持するために転送および連合学習を使用して作成されます。
この研究では、心不全、関節リウマチなど、さまざまな条件でAI駆動型アルゴリズムの入力として関連する機能を選択する際のゲームの適用性を示します。
次に、個々の機関の外で患者レベルのデータを共有することなく、メンタルヘルス障害のある患者のアルツハイマー病の結果と自殺リスクの研究において、調和した多施設EHRデータの調和したゲームの適用を強調します。
要約(オリジナル)
The adoption of EHRs has expanded opportunities to leverage data-driven algorithms in clinical care and research. A major bottleneck in effectively conducting multi-institutional EHR studies is the data heterogeneity across systems with numerous codes that either do not exist or represent different clinical concepts across institutions. The need for data privacy further limits the feasibility of including multi-institutional patient-level data required to study similarities and differences across patient subgroups. To address these challenges, we developed the GAME algorithm. Tested and validated across 7 institutions and 2 languages, GAME integrates data in several levels: (1) at the institutional level with knowledge graphs to establish relationships between codes and existing knowledge sources, providing the medical context for standard codes and their relationship to each other; (2) between institutions, leveraging language models to determine the relationships between institution-specific codes with established standard codes; and (3) quantifying the strength of the relationships between codes using a graph attention network. Jointly trained embeddings are created using transfer and federated learning to preserve data privacy. In this study, we demonstrate the applicability of GAME in selecting relevant features as inputs for AI-driven algorithms in a range of conditions, e.g., heart failure, rheumatoid arthritis. We then highlight the application of GAME harmonized multi-institutional EHR data in a study of Alzheimer’s disease outcomes and suicide risk among patients with mental health disorders, without sharing patient-level data outside individual institutions.
arxiv情報
著者 | Doudou Zhou,Han Tong,Linshanshan Wang,Suqi Liu,Xin Xiong,Ziming Gan,Romain Griffier,Boris Hejblum,Yun-Chung Liu,Chuan Hong,Clara-Lea Bonzel,Tianrun Cai,Kevin Pan,Yuk-Lam Ho,Lauren Costa,Vidul A. Panickan,J. Michael Gaziano,Kenneth Mandl,Vianney Jouhet,Rodolphe Thiebaut,Zongqi Xia,Kelly Cho,Katherine Liao,Tianxi Cai |
発行日 | 2025-02-12 16:29:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google