要約
私たちは、$|\mathcal{U}|$ エージェントが中央サーバーの調整の下で連携して、対応する $|\mathcal{U}|$ に合わせた推奨事項を提供する、フェデレーテッド コンテキスト コンビナトリアル カスケード バンディットの問題を研究します。
既存の作品は、エージェントの完全な参加とグローバル同期を必要とする同期フレームワークを考慮するか、同一の動作を持つユーザーの同質性を前提としています。
これらの制限は、(1) 強制的な同期は必要なく、すべてのエージェントがサーバーと独立して通信する非同期通信パラダイムで動作するフェデレーテッド エージェント、(2) ユーザーを階層化できる異種ユーザーの動作を考慮することで、これらの制限を克服します。
|\mathcal{U}|$ 潜在ユーザー クラスター。それぞれが異なる好みを示します。
この設定では、繊細な通信プロトコルを備えた UCB タイプのアルゴリズムを提案します。
理論的分析を通じて、対数的な通信コストのみを発生させながら、同期フレームワークで達成されるのと同等のサブリニアリグレス限界を与えます。
合成データセットと現実世界のデータセットの経験的評価により、リグアレスと通信コストの観点からアルゴリズムの優れたパフォーマンスが検証されます。
要約(オリジナル)
We study the problem of federated contextual combinatorial cascading bandits, where $|\mathcal{U}|$ agents collaborate under the coordination of a central server to provide tailored recommendations to the $|\mathcal{U}|$ corresponding users. Existing works consider either a synchronous framework, necessitating full agent participation and global synchronization, or assume user homogeneity with identical behaviors. We overcome these limitations by considering (1) federated agents operating in an asynchronous communication paradigm, where no mandatory synchronization is required and all agents communicate independently with the server, (2) heterogeneous user behaviors, where users can be stratified into $J \le |\mathcal{U}|$ latent user clusters, each exhibiting distinct preferences. For this setting, we propose a UCB-type algorithm with delicate communication protocols. Through theoretical analysis, we give sub-linear regret bounds on par with those achieved in the synchronous framework, while incurring only logarithmic communication costs. Empirical evaluation on synthetic and real-world datasets validates our algorithm’s superior performance in terms of regrets and communication costs.
arxiv情報
著者 | Hantao Yang,Xutong Liu,Zhiyong Wang,Hong Xie,John C. S. Lui,Defu Lian,Enhong Chen |
発行日 | 2024-02-26 05:31:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google