Improving the Classification Effect of Clinical Images of Diseases for Multi-Source Privacy Protection

要約

医療分野におけるプライバシー データ保護はデータ共有に課題をもたらし、高精度の補助診断モデルをトレーニングするために病院全体でデータを統合する機能が制限されます。
従来の一元的なトレーニング方法は、プライバシー保護原則に違反するため、適用することが困難です。
分散型機械学習フレームワークとしてのフェデレーテッド ラーニングは、この問題の解決に役立ちますが、複数の病院が同時にトレーニングに参加する必要があり、実際にはこれを達成するのは困難です。
これらの課題に対処するために、私たちはデータ ベクトルに基づいた医療プライバシー データ トレーニング フレームワークを提案します。
このフレームワークにより、各病院はプライベート データで事前トレーニングされたモデルを微調整し、データ ベクトル (ソリューション空間におけるモデル パラメーターの最適化方向を表す) を計算し、それらを合計して、複数の病院からのモデル情報を統合する合成重みを生成できます。
このアプローチにより、プライベート データを交換したり、同期トレーニングを必要としたりすることなく、モデルのパフォーマンスが向上します。
実験結果は、この方法が患者のプライバシーを保護しながら、分散したプライベート データ リソースを効果的に利用することを示しています。
このアプローチを使用してトレーニングされた補助診断モデルは、単一の病院が独自にトレーニングしたモデルよりも大幅に優れており、医療データのプライバシー保護とモデルトレーニングの間の矛盾を解決し、医療インテリジェンスの開発を促進するための新しい視点を提供します。

要約(オリジナル)

Privacy data protection in the medical field poses challenges to data sharing, limiting the ability to integrate data across hospitals for training high-precision auxiliary diagnostic models. Traditional centralized training methods are difficult to apply due to violations of privacy protection principles. Federated learning, as a distributed machine learning framework, helps address this issue, but it requires multiple hospitals to participate in training simultaneously, which is hard to achieve in practice. To address these challenges, we propose a medical privacy data training framework based on data vectors. This framework allows each hospital to fine-tune pre-trained models on private data, calculate data vectors (representing the optimization direction of model parameters in the solution space), and sum them up to generate synthetic weights that integrate model information from multiple hospitals. This approach enhances model performance without exchanging private data or requiring synchronous training. Experimental results demonstrate that this method effectively utilizes dispersed private data resources while protecting patient privacy. The auxiliary diagnostic model trained using this approach significantly outperforms models trained independently by a single hospital, providing a new perspective for resolving the conflict between medical data privacy protection and model training and advancing the development of medical intelligence.

arxiv情報

著者 Tian Bowen,Xu Zhengyang,Yin Zhihao,Wang Jingying,Yue Yutao
発行日 2024-08-23 12:52:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク