Data Valuation for Vertical Federated Learning: A Model-free and Privacy-preserving Method

要約

垂直フェデレーテッド ラーニング (VFL) は、予測分析の有望なパラダイムであり、分散型かつプライバシーを保護した方法で複数のデータ サプライヤー (つまり、データ パーティ) とのコラボレーションを通じて、組織 (つまり、タスク パーティ) が予測モデルを強化できるようにします。
VFL への関心が急速に高まっているにもかかわらず、データ当事者が所有するデータの価値を評価するための効果的かつ安全なツールが不足しているため、ビジネスの場面での VFL の適用が妨げられています。
これに応えて、我々は、プライバシーを保護し、タスク固有だがモデルフリーの VFL 用データ評価方法である FedValue を提案します。これは、データ評価メトリクスとフェデレーテッド計算方法で構成されます。
具体的には、まず、MShapley-CMI という新しいデータ評価指標を導入します。
このメトリクスは、機械学習モデルを実行することなく、予測分析タスクに対するデータ当事者の貢献を評価するため、VFL の実世界のアプリケーションに最適です。
次に、プライバシーを保護しながら各データ当事者の MShapley-CMI 値を計算する革新的な連合計算手法を開発します。
6 つの公開データセットに対して行われた広範な実験により、VFL のコンテキストでのデータ評価における FedValue の有効性が検証されました。
さらに、映画の連合レコメンデーションに関するケーススタディを用いて、FedValue の実用性を説明します。

要約(オリジナル)

Vertical Federated learning (VFL) is a promising paradigm for predictive analytics, empowering an organization (i.e., task party) to enhance its predictive models through collaborations with multiple data suppliers (i.e., data parties) in a decentralized and privacy-preserving way. Despite the fast-growing interest in VFL, the lack of effective and secure tools for assessing the value of data owned by data parties hinders the application of VFL in business contexts. In response, we propose FedValue, a privacy-preserving, task-specific but model-free data valuation method for VFL, which consists of a data valuation metric and a federated computation method. Specifically, we first introduce a novel data valuation metric, namely MShapley-CMI. The metric evaluates a data party’s contribution to a predictive analytics task without the need of executing a machine learning model, making it well-suited for real-world applications of VFL. Next, we develop an innovative federated computation method that calculates the MShapley-CMI value for each data party in a privacy-preserving manner. Extensive experiments conducted on six public datasets validate the efficacy of FedValue for data valuation in the context of VFL. In addition, we illustrate the practical utility of FedValue with a case study involving federated movie recommendations.

arxiv情報

著者 Xiao Han,Leye Wang,Junjie Wu,Xiao Fang
発行日 2024-01-01 03:11:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク