Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare

要約

電子健康記録(EHRS)の台頭は、医学研究の新しい機会を解き放ちましたが、プライバシー規制とデータの不均一性は、大規模な機械学習に対する重要な障壁のままです。
Federated Learning(FL)は、生データを共有せずに共同モデリングを可能にしますが、多様な臨床データセットの調和に課題に直面しています。
このホワイトペーパーでは、オントロジーと大規模な言語モデル(LLM)を統合する2段階のデータアラインメント戦略を提示して、ヘルスケアの安全なプライバシーを提供するFLをサポートし、EHRデータのセマンティックマッピングを含む現実世界のプロジェクトでの有効性を実証します。

要約(オリジナル)

The rise of electronic health records (EHRs) has unlocked new opportunities for medical research, but privacy regulations and data heterogeneity remain key barriers to large-scale machine learning. Federated learning (FL) enables collaborative modeling without sharing raw data, yet faces challenges in harmonizing diverse clinical datasets. This paper presents a two-step data alignment strategy integrating ontologies and large language models (LLMs) to support secure, privacy-preserving FL in healthcare, demonstrating its effectiveness in a real-world project involving semantic mapping of EHR data.

arxiv情報

著者 Natallia Kokash,Lei Wang,Thomas H. Gillespie,Adam Belloum,Paola Grosso,Sara Quinney,Lang Li,Bernard de Bono
発行日 2025-05-26 14:09:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SE パーマリンク