Tight Bounds for $γ$-Regret via the Decision-Estimation Coefficient

要約

この研究では、任意の構造化バンディット問題に対する $\gamma$-regret、つまり最適解の $\gamma$ 倍のベンチマークと比較したときに生じる後悔の統計的特徴を示します。
$\gamma$-regret は、$f \in \mathcal{F}$ の正確な最適値を見つけることが困難な関数クラス $\mathcal{F}$ に対する構造化バンディット問題で発生します。
私たちの特性評価は、クラス $\mathcal{F}$ の統計的複雑さパラメーターである $\gamma$-DEC の観点から与えられます。これは、Foster et al., 2023 の制約付き決定推定係数 (DEC) の修正です (Foster et al., 2021 の元のオフセット DEC と密接に関連しています)。
下限は、$\gamma$-DEC があらゆるモデル クラス $\mathcal{F}$ の基本的な制限であることを示しています。どのアルゴリズムでも、そのアルゴリズムの $\gamma$-regret が $\mathcal{F}$ の $\gamma$-DEC に(ほぼ)比例する $f \in \mathcal{F}$ が存在します。
ほぼ一致する $\gamma$-regret を達成するアルゴリズムが存在することを示す上限を提供します。
DEC に関する以前の結果を $\gamma$-regret ケースに適用する際には大きな課題があるため、下限と上限の両方に新しい技術と新しいアルゴリズムが必要です。

要約(オリジナル)

In this work, we give a statistical characterization of the $\gamma$-regret for arbitrary structured bandit problems, the regret which arises when comparing against a benchmark that is $\gamma$ times the optimal solution. The $\gamma$-regret emerges in structured bandit problems over a function class $\mathcal{F}$ where finding an exact optimum of $f \in \mathcal{F}$ is intractable. Our characterization is given in terms of the $\gamma$-DEC, a statistical complexity parameter for the class $\mathcal{F}$, which is a modification of the constrained Decision-Estimation Coefficient (DEC) of Foster et al., 2023 (and closely related to the original offset DEC of Foster et al., 2021). Our lower bound shows that the $\gamma$-DEC is a fundamental limit for any model class $\mathcal{F}$: for any algorithm, there exists some $f \in \mathcal{F}$ for which the $\gamma$-regret of that algorithm scales (nearly) with the $\gamma$-DEC of $\mathcal{F}$. We provide an upper bound showing that there exists an algorithm attaining a nearly matching $\gamma$-regret. Due to significant challenges in applying the prior results on the DEC to the $\gamma$-regret case, both our lower and upper bounds require novel techniques and a new algorithm.

arxiv情報

著者 Margalit Glasgow,Alexander Rakhlin
発行日 2023-07-21 17:54:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク