FedPDD: A Privacy-preserving Double Distillation Framework for Cross-silo Federated Recommendation


クロスプラットフォーム レコメンデーションは、異なるプラットフォームから異種の機能を収集することでレコメンデーションの精度を向上させることを目的としています。
フェデレーテッド ラーニング (FL) は、レコメンデーション シナリオにおけるデータ サイロの問題に対処するための実用的なソリューションです。
既存のクロスサイロ FL 手法は、モデル情報を送信して、重複するユーザーのデータを活用してグローバル モデルを共同で構築します。
この論文では、重複するユーザーが制限されている場合に知識を効率的に転送する、クロスサイロフェデレーション推奨用の FedPDD と呼ばれる新しいプライバシー保護二重蒸留フレームワークを提案します。
具体的には、二重蒸留戦略により、ローカル モデルは相手からの形式的知識だけでなく、過去の予測からの暗黙的知識も学習できるようになります。
HetRec-MovieLens と Criteo という 2 つの実際のレコメンデーション データセットでの実験では、最先端のアプローチと比較した FedPDD の有効性が実証されています。


Cross-platform recommendation aims to improve recommendation accuracy by gathering heterogeneous features from different platforms. However, such cross-silo collaborations between platforms are restricted by increasingly stringent privacy protection regulations, thus data cannot be aggregated for training. Federated learning (FL) is a practical solution to deal with the data silo problem in recommendation scenarios. Existing cross-silo FL methods transmit model information to collaboratively build a global model by leveraging the data of overlapped users. However, in reality, the number of overlapped users is often very small, thus largely limiting the performance of such approaches. Moreover, transmitting model information during training requires high communication costs and may cause serious privacy leakage. In this paper, we propose a novel privacy-preserving double distillation framework named FedPDD for cross-silo federated recommendation, which efficiently transfers knowledge when overlapped users are limited. Specifically, our double distillation strategy enables local models to learn not only explicit knowledge from the other party but also implicit knowledge from its past predictions. Moreover, to ensure privacy and high efficiency, we employ an offline training scheme to reduce communication needs and privacy leakage risk. In addition, we adopt differential privacy to further protect the transmitted information. The experiments on two real-world recommendation datasets, HetRec-MovieLens and Criteo, demonstrate the effectiveness of FedPDD compared to the state-of-the-art approaches.


著者 Sheng Wan,Dashan Gao,Hanlin Gu,Daning Hu
発行日 2024-01-30 16:32:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.DC, cs.IR, cs.LG パーマリンク