要約
機密データに関する順次意思決定におけるプライバシーの懸念に動機付けられ、ローカル差別的プライバシー(LDP)の下でのノンパラメトリックコンテキストマルチアライド盗賊(MAB)の課題に対処します。
一致するミニマックスの下限によってサポートされているミニマックスの最適性を示す均一な満点に縛られたタイプの推定器を開発します。
さらに、補助データセットが利用可能な場合を検討します。これは、(おそらく不均一な)LDP制約の対象となります。
広く使用されている共変量シフトフレームワークの下で、補助データを効果的に利用するためのジャンプスタートスキームを提案します。その最適性は、一致する下限によってさらに確立されます。
合成データセットと実世界の両方のデータセットの包括的な実験は、当社の理論的結果を検証し、提案された方法の有効性を強調しています。
要約(オリジナル)
Motivated by privacy concerns in sequential decision-making on sensitive data, we address the challenge of nonparametric contextual multi-armed bandits (MAB) under local differential privacy (LDP). We develop a uniform-confidence-bound-type estimator, showing its minimax optimality supported by a matching minimax lower bound. We further consider the case where auxiliary datasets are available, subject also to (possibly heterogeneous) LDP constraints. Under the widely-used covariate shift framework, we propose a jump-start scheme to effectively utilize the auxiliary data, the minimax optimality of which is further established by a matching lower bound. Comprehensive experiments on both synthetic and real-world datasets validate our theoretical results and underscore the effectiveness of the proposed methods.
arxiv情報
著者 | Yuheng Ma,Feiyu Jiang,Zifeng Zhao,Hanfang Yang,Yi Yu |
発行日 | 2025-03-25 16:13:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google