A Federated Learning Benchmark for Drug-Target Interaction

要約

薬物標的相互作用 (DTI) ドメインで医薬品データを集約することで、命を救うブレークスルーを実現できる可能性があります。
しかし、規制上の制約と商業的利益のために、それは非常に難しいことで知られています。
この作業は、連合学習の適用を提案しています。これは、エンティティのデータやその他の高レベルの要約を明らかにする情報の共有を必要としないため、業界の制約と調和できると主張しています。
代表的な GraphDTA モデルと KIBA データセットで使用すると、プライバシーを保護しない最良の代替手段と比較して、最大 15% のパフォーマンス向上を実現します。
私たちの広範な一連の実験は、他のドメインとは異なり、DTI データセット内の非 IID データ分布が FL パフォーマンスを低下させないことを示しています。
さらに、新しいデータを追加するメリットと、クライアントを追加するコストとの間に重要なトレードオフがあることも確認しています。

要約(オリジナル)

Aggregating pharmaceutical data in the drug-target interaction (DTI) domain has the potential to deliver life-saving breakthroughs. It is, however, notoriously difficult due to regulatory constraints and commercial interests. This work proposes the application of federated learning, which we argue to be reconcilable with the industry’s constraints, as it does not require sharing of any information that would reveal the entities’ data or any other high-level summary of it. When used on a representative GraphDTA model and the KIBA dataset it achieves up to 15% improved performance relative to the best available non-privacy preserving alternative. Our extensive battery of experiments shows that, unlike in other domains, the non-IID data distribution in the DTI datasets does not deteriorate FL performance. Additionally, we identify a material trade-off between the benefits of adding new data, and the cost of adding more clients.

arxiv情報

著者 Filip Svoboda,Gianluca Mittone,Nicholas D. Lane,Pietro Lio
発行日 2023-02-15 14:21:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG パーマリンク