On Differentially Private Federated Linear Contextual Bandits

要約

差分プライバシー下でのクロスサイロ連合線形コンテキスト バンディット (LCB) 問題を検討します。
この設定では、複数のサイロまたはエージェントがローカル ユーザーと対話し、中央サーバーを介して通信して、各ユーザーのプライバシーを犠牲にすることなくコラボレーションを実現します。
\cite{dubey2020differentially} の最先端のアルゴリズムで 2 つの問題を特定します: (i) 主張されたプライバシー保護の失敗と (ii) 後悔の境界におけるノイズの誤算。
これらの問題を解決するために、私たちは 2 段階の原則に基づくアプローチを採用しています。
まず、一般的な連合 LCB アルゴリズムと柔軟なプライバシー プロトコルで構成されるアルゴリズム フレームワークを設計します。
次に、提案されたフレームワークを活用して、2 つの異なるプライバシー制約の下で連合 LCB を研究します。
最初に、サイロレベルのローカル差分プライバシーの下でプライバシーと後悔の保証を確立します。これにより、最先端のアルゴリズムに存在する問題が修正されます。
リグレットのパフォーマンスをさらに改善するために、次に、差分プライバシーのシャッフル モデルを検討します。このモデルの下で、信頼できるサーバーがなくても、アルゴリズムがほぼ「最適な」リグレットを達成できることを示します。
これを 2 つの異なるスキームで実現します。1 つは、DP メカニズムのシャッフルによるプライバシー増幅の新しい結果に依存し、もう 1 つは、ベクトル和のシャッフル プロトコルをツリーベースのメカニズムに統合することを利用します。どちらも独立している可能性があります。
興味。
最後に、合成データと実際のデータの両方から生成されたコンテキスト バンディット インスタンスに対する数値評価により、理論的結果をサポートします。

要約(オリジナル)

We consider cross-silo federated linear contextual bandit (LCB) problem under differential privacy. In this setting, multiple silos or agents interact with the local users and communicate via a central server to realize collaboration while without sacrificing each user’s privacy. We identify two issues in the state-of-the-art algorithm of \cite{dubey2020differentially}: (i) failure of claimed privacy protection and (ii) noise miscalculation in regret bound. To resolve these issues, we take a two-step principled approach. First, we design an algorithmic framework consisting of a generic federated LCB algorithm and flexible privacy protocols. Then, leveraging the proposed framework, we study federated LCBs under two different privacy constraints. We first establish privacy and regret guarantees under silo-level local differential privacy, which fix the issues present in state-of-the-art algorithm. To further improve the regret performance, we next consider shuffle model of differential privacy, under which we show that our algorithm can achieve nearly “optimal” regret without a trusted server. We accomplish this via two different schemes — one relies on a new result on privacy amplification via shuffling for DP mechanisms and another one leverages the integration of a shuffle protocol for vector sum into the tree-based mechanism, both of which might be of independent interest. Finally, we support our theoretical results with numerical evaluations over contextual bandit instances generated from both synthetic and real-life data.

arxiv情報

著者 Xingyu Zhou,Sayak Ray Chowdhury
発行日 2023-02-27 16:47:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク