Corruption-Robust Lipschitz Contextual Search


破損したバイナリ信号を用いてリプシッツ関数を学習する問題を研究している。学習者は$L$-リプシッツ関数$fを学習しようとする:[0,1]^d \rightarrow [0, L]$ を学習する。ラウンドは全部で$T$回ある。各ラウンド$t$で、敵は入力空間の文脈ベクトル$x_t$を選択し、学習者は真の関数値$f(x_t)$を推測し、推測が高いか低いかを示す二値信号を受け取る。合計$C$回のラウンドで、信号が破損する可能性があるが、$C$の値は学習者には分からない。学習者の目標は累積損失を小さくすることである。本研究では、新しいアルゴリズム技術(engostic checking)と新しい解析技術を導入する。私は次のようなアルゴリズムを設計する:対称損失に対して、学習者は$d = 1$で$Lcdot O(Clog T)$、$d > 1$で$Lcdot O_d(Clog T + T^{(d-1)/d})$の後悔を達成し、価格付け損失に対して、学習者は$Lcdot Ⓐwidetilde{O} (T^{d/(d+1)} + Ccdot T^{1/(d+1)})$の後悔を達成する。


I study the problem of learning a Lipschitz function with corrupted binary signals. The learner tries to learn a $L$-Lipschitz function $f: [0,1]^d \rightarrow [0, L]$ that the adversary chooses. There is a total of $T$ rounds. In each round $t$, the adversary selects a context vector $x_t$ in the input space, and the learner makes a guess to the true function value $f(x_t)$ and receives a binary signal indicating whether the guess is high or low. In a total of $C$ rounds, the signal may be corrupted, though the value of $C$ is \emph{unknown} to the learner. The learner’s goal is to incur a small cumulative loss. This work introduces the new algorithmic technique \emph{agnostic checking} as well as new analysis techniques. I design algorithms which: for the symmetric loss, the learner achieves regret $L\cdot O(C\log T)$ with $d = 1$ and $L\cdot O_d(C\log T + T^{(d-1)/d})$ with $d > 1$; for the pricing loss, the learner achieves regret $L\cdot \widetilde{O} (T^{d/(d+1)} + C\cdot T^{1/(d+1)})$.


著者 Shiliang Zuo
発行日 2023-10-03 15:06:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG, stat.ML パーマリンク