Developing Federated Time-to-Event Scores Using Heterogeneous Real-World Survival Data

要約

生存分析は、多くの医療アプリケーションの基本的なコンポーネントとして機能し、患者の特定のイベント (特定の病気の発症や死亡など) までの時間を決定することが臨床上の意思決定にとって重要です。
スコアリング システムは、迅速かつ効率的なリスク予測のために広く使用されています。
ただし、生存スコアを構築するための既存の方法では、データが単一のソースから発信されることを前提としており、複数のデータ所有者との共同作業ではプライバシーの課題が生じます。
私たちは、プライバシーと通信効率の両方を確保する、マルチサイト生存結果の連合スコアリング システムを構築するための新しいフレームワークを提案します。
私たちは、シンガポールと米国の救急部門から得られた異種生存データを持つサイトにアプローチを適用しました。
さらに、各サイトでローカル スコアを独自に開発しました。
各参加者サイトからのデータセットをテストしたところ、私たちが提案したフェデレーテッド スコアリング システムは一貫してすべてのローカル モデルを上回り、受信者動作特性曲線下統合面積 (iAUC) 値がより高く、最大 11.6% の改善が見られました。
さらに、フェデレーテッド スコアの時間依存 AUC(t) 値はローカル スコアよりも優れており、ほとんどの時点で信頼区間 (CI) が狭いことが示されました。
私たちが提案した手法によって開発されたモデルは、各局所で効果的なパフォーマンスを示し、医療研究にとって注目すべき意義を示しています。
私たちが提案したフェデレーテッド スコアリング モデル トレーニングに参加しているサイトは、予測の精度と効率が向上した生存モデルを取得することで利益を得ました。
この研究は、プライバシーを保護するフェデレーション生存スコア生成フレームワークの有効性と、現実世界の異種生存データへの適用可能性を実証しています。

要約(オリジナル)

Survival analysis serves as a fundamental component in numerous healthcare applications, where the determination of the time to specific events (such as the onset of a certain disease or death) for patients is crucial for clinical decision-making. Scoring systems are widely used for swift and efficient risk prediction. However, existing methods for constructing survival scores presume that data originates from a single source, posing privacy challenges in collaborations with multiple data owners. We propose a novel framework for building federated scoring systems for multi-site survival outcomes, ensuring both privacy and communication efficiency. We applied our approach to sites with heterogeneous survival data originating from emergency departments in Singapore and the United States. Additionally, we independently developed local scores at each site. In testing datasets from each participant site, our proposed federated scoring system consistently outperformed all local models, evidenced by higher integrated area under the receiver operating characteristic curve (iAUC) values, with a maximum improvement of 11.6%. Additionally, the federated score’s time-dependent AUC(t) values showed advantages over local scores, exhibiting narrower confidence intervals (CIs) across most time points. The model developed through our proposed method exhibits effective performance on each local site, signifying noteworthy implications for healthcare research. Sites participating in our proposed federated scoring model training gained benefits by acquiring survival models with enhanced prediction accuracy and efficiency. This study demonstrates the effectiveness of our privacy-preserving federated survival score generation framework and its applicability to real-world heterogeneous survival data.

arxiv情報

著者 Siqi Li,Yuqing Shang,Ziwen Wang,Qiming Wu,Chuan Hong,Yilin Ning,Di Miao,Marcus Eng Hock Ong,Bibhas Chakraborty,Nan Liu
発行日 2024-03-08 11:32:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク