A Privacy Preserving System for Movie Recommendations Using Federated Learning

要約

レコメンダー システムはここ数年で至る所に普及しました。
これらは、多くのユーザーが直面している選択の横暴の問題を解決し、多くのオンライン ビジネスでエンゲージメントと売上を促進するために利用されています。
ソーシャルネットワーク内にフィルターバブルを作成するなどの他の批判に加えて、レコメンダーシステムは大量の個人データを収集するとしてしばしば非難されます。
ただし、レコメンデーションをパーソナライズするには、基本的に個人情報が必要です。
フェデレーテッド ラーニングと呼ばれる最近の分散学習スキームにより、個人ユーザー データを中央で収集せずに学習できるようになりました。
その結果、私たちは、複数のレベルでプライバシーと信頼性を提供する、映画を推薦するためのレコメンダー システムを紹介します。まず第一に、このシステムはフェデレーテッド ラーニングを使用してトレーニングされているため、その性質上、プライバシーを保護しながら、ユーザーは次のようなメリットを得ることができます。
グローバルな洞察。
さらに、FedQ と呼ばれる新しいフェデレーテッド ラーニング スキームが採用されており、非 i.i.d. 性と小規模なローカル データセットの問題に対処するだけでなく、クライアントの更新を早期に集約することで入力データの再構築攻撃を防止します。
最後に、通信オーバーヘッドを削減するために圧縮が適用され、交換されるニューラル ネットワークのパラメータ化が元のサイズの数分の一に大幅に圧縮されます。
これにより、損失の多い量子化段階を通じてデータのプライバシーも向上する可能性があると推測しています。

要約(オリジナル)

Recommender systems have become ubiquitous in the past years. They solve the tyranny of choice problem faced by many users, and are utilized by many online businesses to drive engagement and sales. Besides other criticisms, like creating filter bubbles within social networks, recommender systems are often reproved for collecting considerable amounts of personal data. However, to personalize recommendations, personal information is fundamentally required. A recent distributed learning scheme called federated learning has made it possible to learn from personal user data without its central collection. Consequently, we present a recommender system for movie recommendations, which provides privacy and thus trustworthiness on multiple levels: First and foremost, it is trained using federated learning and thus, by its very nature, privacy-preserving, while still enabling users to benefit from global insights. Furthermore, a novel federated learning scheme, called FedQ, is employed, which not only addresses the problem of non-i.i.d.-ness and small local datasets, but also prevents input data reconstruction attacks by aggregating client updates early. Finally, to reduce the communication overhead, compression is applied, which significantly compresses the exchanged neural network parametrizations to a fraction of their original size. We conjecture that this may also improve data privacy through its lossy quantization stage.

arxiv情報

著者 David Neumann,Andreas Lutz,Karsten Müller,Wojciech Samek
発行日 2023-11-17 16:47:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.IR, cs.LG パーマリンク