要約
ヘルスケア分野で人工知能 (AI) モデルを構築する際の最大の課題の 1 つは、データ共有です。
医療データはプライベートで機密性があり、異質であるため、モデリングに十分なデータを収集するのは困難でコストがかかり、場合によっては不可能です。
この論文では、ローカル データセットを共有せずに、複数大陸 (ヨーロッパ、北米、アジア) のデータセットを使用したグローバル ヘルスケア モデリングのフレームワークを提案し、その有効性を検証するための研究モデルとして血糖管理を選択します。
技術的には、ブロックチェーン対応のフェデレーテッド ラーニングは、医療データのプライバシーと安全性要件を満たすように適応して実装され、その一方で、オンチェーンのインセンティブ メカニズムを使用して誠実な参加に報酬を与え、悪意のある活動を罰します。
実験結果は、提案されたフレームワークが効果的かつ効率的であり、プライバシーが保護されることを示しています。
その予測精度は、限られた個人データからトレーニングされたモデルよりもはるかに優れており、一元化されたデータセットからの結果と同等か、それよりわずかに優れています。
この取り組みは、偏見を減らし人類に利益をもたらすために追加データが重要である医療プロジェクトにおける国際協力への道を開きます。
要約(オリジナル)
One of the biggest challenges of building artificial intelligence (AI) model in healthcare area is the data sharing. Since healthcare data is private, sensitive, and heterogeneous, collecting sufficient data for modelling is exhausted, costly, and sometimes impossible. In this paper, we propose a framework for global healthcare modelling using datasets from multi-continents (Europe, North America and Asia) while without sharing the local datasets, and choose glucose management as a study model to verify its effectiveness. Technically, blockchain-enabled federated learning is implemented with adaption to make it meet with the privacy and safety requirements of healthcare data, meanwhile rewards honest participation and penalize malicious activities using its on-chain incentive mechanism. Experimental results show that the proposed framework is effective, efficient, and privacy preserved. Its prediction accuracy is much better than the models trained from limited personal data and is similar to, and even slightly better than, the results from a centralized dataset. This work paves the way for international collaborations on healthcare projects, where additional data is crucial for reducing bias and providing benefits to humanity.
arxiv情報
著者 | Rui Sun,Zhipeng Wang,Hengrui Zhang,Ming Jiang,Yizhe Wen,Jiqun Zhang,Jiahao Sun,Shuoying Zhang,Erwu Liu,Kezhi Li |
発行日 | 2024-10-23 14:55:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google