要約
会話型レコメンダー システムは、ユーザーの好みを効率的に引き出すための強力なソリューションとして登場しました。
これらのシステムは、「キーワード」に関連するクエリを対話的にユーザーに提示し、ユーザーのフィードバックを活用してユーザーの好みをより効率的に推定します。
それにもかかわらず、既存のアルゴリズムのほとんどは集中型アプローチを採用しています。
このペーパーでは、位相消去ベースのフェデレーテッド会話型バンディット アルゴリズムである FedConPE を紹介します。このアルゴリズムでは、$M$ エージェントが、安全なデータ管理を確保しながら、中央サーバーの助けを借りてグローバルなコンテキスト線形バンディット問題を協力して解決します。
すべてのクライアントを効果的に調整し、収集されたデータを集約するために、FedConPE は適応型アプローチを使用して、特徴空間のすべての次元にわたる不確実性を最小限に抑える重要な用語を構築します。
さらに、既存のフェデレーテッド線形バンディット アルゴリズムと比較して、FedConPE は計算効率と通信効率が向上し、プライバシー保護も強化されます。
私たちの理論的分析は、FedConPE が累積後悔の点で最適に近いミニマックスであることを示しています。
通信費や会話頻度にも上限を設けております。
包括的な評価により、FedConPE は、使用する会話を減らしながら、既存の会話バンディット アルゴリズムよりも優れたパフォーマンスを発揮することが実証されています。
要約(オリジナル)
Conversational recommender systems have emerged as a potent solution for efficiently eliciting user preferences. These systems interactively present queries associated with ‘key terms’ to users and leverage user feedback to estimate user preferences more efficiently. Nonetheless, most existing algorithms adopt a centralized approach. In this paper, we introduce FedConPE, a phase elimination-based federated conversational bandit algorithm, where $M$ agents collaboratively solve a global contextual linear bandit problem with the help of a central server while ensuring secure data management. To effectively coordinate all the clients and aggregate their collected data, FedConPE uses an adaptive approach to construct key terms that minimize uncertainty across all dimensions in the feature space. Furthermore, compared with existing federated linear bandit algorithms, FedConPE offers improved computational and communication efficiency as well as enhanced privacy protections. Our theoretical analysis shows that FedConPE is minimax near-optimal in terms of cumulative regret. We also establish upper bounds for communication costs and conversation frequency. Comprehensive evaluations demonstrate that FedConPE outperforms existing conversational bandit algorithms while using fewer conversations.
arxiv情報
著者 | Zhuohua Li,Maoli Liu,John C. S. Lui |
発行日 | 2024-06-20 16:11:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google