Corruption-Robust Lipschitz Contextual Search

要約

私は破損したバイナリ信号を使用してリプシッツ関数を学習する問題を研究しています。
学習者は、攻撃者が選択した $L$-リプシッツ関数 $f: [0,1]^d \rightarrow [0, L]$ を学習しようとします。
合計 $T$ ラウンドがあります。
各ラウンド $t$ で、敵対者は入力空間内のコンテキスト ベクトル $x_t$ を選択し、学習者は真の関数値 $f(x_t)$ を推測し、その推測が高いかどうかを示すバイナリ信号を受け取ります。
低い。
$C$ の値は学習者にとって \emph{未知}であっても、合計 $C$ ラウンドで信号が破損する可能性があります。
学習者の目標は、小さな累積損失を被ることです。
この研究では、新しいアルゴリズム手法 \emph{agnostic check} と新しい分析手法が導入されています。
私は次のようなアルゴリズムを設計します: 対称損失の場合、学習者は $d = 1$ および $L\cdot O_d(C\log T + T^{(d-
1)/d})$ ($d > 1$);
価格設定の損失に対して、学習者は $L\cdot \widetilde{O} (T^{d/(d+1)} + C\cdot T^{1/(d+1)})$ を後悔します。

要約(オリジナル)

I study the problem of learning a Lipschitz function with corrupted binary signals. The learner tries to learn a $L$-Lipschitz function $f: [0,1]^d \rightarrow [0, L]$ that the adversary chooses. There is a total of $T$ rounds. In each round $t$, the adversary selects a context vector $x_t$ in the input space, and the learner makes a guess to the true function value $f(x_t)$ and receives a binary signal indicating whether the guess is high or low. In a total of $C$ rounds, the signal may be corrupted, though the value of $C$ is \emph{unknown} to the learner. The learner’s goal is to incur a small cumulative loss. This work introduces the new algorithmic technique \emph{agnostic checking} as well as new analysis techniques. I design algorithms which: for the symmetric loss, the learner achieves regret $L\cdot O(C\log T)$ with $d = 1$ and $L\cdot O_d(C\log T + T^{(d-1)/d})$ with $d > 1$; for the pricing loss, the learner achieves regret $L\cdot \widetilde{O} (T^{d/(d+1)} + C\cdot T^{1/(d+1)})$.

arxiv情報

著者 Shiliang Zuo
発行日 2023-11-29 16:19:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク