An Efficient Interior-Point Method for Online Convex Optimization


$T$ 期間後のアルゴリズムのリグアロングは $O(\sqrt{T \log T})$ で、これは対数項までの最小値です。
さらに、新しいアルゴリズムは、リグレス限界が期間 $1,\ldots,T$ だけでなく、すべてのサブ間隔 $s,s+1,\ldots,t$ にも適用されるという意味で適応的です。
このアルゴリズムの実行時間は、リグアント最小化のために新たに導入された内点アルゴリズムの実行時間と一致します。 $n$ 次元空間では、各反復中に、新しいアルゴリズムは、 $n$ 次元の制約付き凸最適化問題やおそらく多くの制約を解くのではなく、基本的に $n$ 次の線形方程式系を解きます。


A new algorithm for regret minimization in online convex optimization is described. The regret of the algorithm after $T$ time periods is $O(\sqrt{T \log T})$ – which is the minimum possible up to a logarithmic term. In addition, the new algorithm is adaptive, in the sense that the regret bounds hold not only for the time periods $1,\ldots,T$ but also for every sub-interval $s,s+1,\ldots,t$. The running time of the algorithm matches that of newly introduced interior point algorithms for regret minimization: in $n$-dimensional space, during each iteration the new algorithm essentially solves a system of linear equations of order $n$, rather than solving some constrained convex optimization problem in $n$ dimensions and possibly many constraints.


著者 Elad Hazan,Nimrod Megiddo
発行日 2023-07-21 16:12:46+00:00
カテゴリー: cs.LG, math.OC パーマリンク