Data Valuation for Vertical Federated Learning: A Model-free and Privacy-preserving Method


VFL(Vertical Federated Learning)は予測分析のための有望なパラダイムであり、組織(=タスク・パーティ)が複数のデータ供給者(=データ・パーティ)とのコラボレーションを通じて、分散化されたプライバシー保護された方法で予測モデルを強化することを可能にする。VFLへの関心が急速に高まっているにもかかわらず、データ当事者が所有するデータの価値を評価するための効果的で安全なツールがないことが、ビジネス文脈におけるVFLの適用を妨げています。これに対し、我々は、プライバシーを保護し、タスクに特化した、しかしモデルフリーのVFLのためのデータ評価手法であるFedValueを提案する。具体的には、まずMShapley-CMIという新しいデータ評価指標を導入する。この評価指標は、機械学習モデルを実行することなく、予測分析タスクに対するデータパーティの貢献度を評価するものであり、VFLの実世界での応用に適している。次に、各データパーティのMShapley-CMI値をプライバシーを保持した方法で計算する革新的な連携計算手法を開発する。6つの公開データセットで実施した広範な実験により、VFLの文脈におけるデータ評価のためのFedValueの有効性を検証する。さらに、フェデレートされた映画推薦を含むケーススタディでFedValueの実用的な有用性を説明する。


Vertical Federated learning (VFL) is a promising paradigm for predictive analytics, empowering an organization (i.e., task party) to enhance its predictive models through collaborations with multiple data suppliers (i.e., data parties) in a decentralized and privacy-preserving way. Despite the fast-growing interest in VFL, the lack of effective and secure tools for assessing the value of data owned by data parties hinders the application of VFL in business contexts. In response, we propose FedValue, a privacy-preserving, task-specific but model-free data valuation method for VFL, which consists of a data valuation metric and a federated computation method. Specifically, we first introduce a novel data valuation metric, namely MShapley-CMI. The metric evaluates a data party’s contribution to a predictive analytics task without the need of executing a machine learning model, making it well-suited for real-world applications of VFL. Next, we develop an innovative federated computation method that calculates the MShapley-CMI value for each data party in a privacy-preserving manner. Extensive experiments conducted on six public datasets validate the efficacy of FedValue for data valuation in the context of VFL. In addition, we illustrate the practical utility of FedValue with a case study involving federated movie recommendations.


著者 Xiao Han,Leye Wang,Junjie Wu,Xiao Fang
発行日 2024-01-04 07:19:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク