Improved Space Bounds for Learning with Experts

要約

$n$ の専門家との $T$ 日間にわたる専門家のアドバイスの問題を使用して、スペースと後悔の間のトレードオフを改善します。
$\delta \in (0,1)$ に対して $n^{\delta}$ のスペース バジェットが与えられた場合、後悔を達成するアルゴリズム $\tilde{O}(n^2 T^{1/(1+
\delta)})$ は、[PZ23] の最近の研究における後悔限界 $\tilde{O}(n^2 T^{2/(2+\delta)})$ を改善しています。
この改善は、アルゴリズムの後悔が $\tilde{O}_n(\sqrt{T})$ に近づく領域 $\delta \rightarrow 1$ で特に顕著であり、標準のオンライン設定での $T$ 依存性と一致します。
スペース制限。

要約(オリジナル)

We give improved tradeoffs between space and regret for the online learning with expert advice problem over $T$ days with $n$ experts. Given a space budget of $n^{\delta}$ for $\delta \in (0,1)$, we provide an algorithm achieving regret $\tilde{O}(n^2 T^{1/(1+\delta)})$, improving upon the regret bound $\tilde{O}(n^2 T^{2/(2+\delta)})$ in the recent work of [PZ23]. The improvement is particularly salient in the regime $\delta \rightarrow 1$ where the regret of our algorithm approaches $\tilde{O}_n(\sqrt{T})$, matching the $T$ dependence in the standard online setting without space restrictions.

arxiv情報

著者 Anders Aamand,Justin Y. Chen,Huy Lê Nguyen,Sandeep Silwal
発行日 2023-03-02 18:11:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG パーマリンク