Non-stationary Projection-free Online Learning with Dynamic and Adaptive Regret Guarantees

要約

投影のないオンライン学習は、複雑な制約を持つ高次元の問題を効率的に解決できるため、関心が高まっています。
しかし、既存のプロジェクションフリーのオンライン手法のほとんどは、静的な後悔を最小限に抑えることに焦点を当てており、残念ながら環境の変化という課題を捉えることができません。
この論文では、非定常投影のないオンライン学習を調査し、パフォーマンスを測定するために動的リグレスと適応的リグレスを選択します。
具体的には、まず、$\text{BOGD}_\text{IP}$ という名前の既存の射影のない手法に新しい動的リグレス分析を提供し、$\mathcal{O}(T^{3/4}(
1+P_T))$ 動的リグレット バウンド。$P_T$ はコンパレータ シーケンスのパス長を示します。
次に、複数の $\text{BOGD}_\text{IP} を実行することで、上限を $\mathcal{O}(T^{3/4}(1+P_T)^{1/4})$ に改善します。
$ 異なるステップ サイズのアルゴリズムを並列に実行し、最適なものをオンザフライで追跡します。
私たちの結果は、射影のないオンライン学習における最初の一般的な動的リグレアバウト限界であり、$P_T = 0$ を設定することで既存の $\mathcal{O}(T^{3/4})$ 静的リグレアメントを回復できます。
さらに、我々は、長さ $\tau$ の任意の区間に対する $\tilde{\mathcal{O}}(\tau^{3/4})$ 適応リグレス限界を達成する射影のない方法を提案します。
その間に静的な後悔。
本質的なアイデアは、一連の $\text{BOGD}_\text{IP}$ アルゴリズムを動的に維持し、メタ アルゴリズムによってそれらを組み合わせるというものです。
さらに、$\mathcal{O}(T^{3/4}(1+P_T)^{1/4})$ 動的リグレス限界も備えていることを示します。
最後に、実証研究により理論的発見が検証されます。

要約(オリジナル)

Projection-free online learning has drawn increasing interest due to its efficiency in solving high-dimensional problems with complicated constraints. However, most existing projection-free online methods focus on minimizing the static regret, which unfortunately fails to capture the challenge of changing environments. In this paper, we investigate non-stationary projection-free online learning, and choose dynamic regret and adaptive regret to measure the performance. Specifically, we first provide a novel dynamic regret analysis for an existing projection-free method named $\text{BOGD}_\text{IP}$, and establish an $\mathcal{O}(T^{3/4}(1+P_T))$ dynamic regret bound, where $P_T$ denotes the path-length of the comparator sequence. Then, we improve the upper bound to $\mathcal{O}(T^{3/4}(1+P_T)^{1/4})$ by running multiple $\text{BOGD}_\text{IP}$ algorithms with different step sizes in parallel, and tracking the best one on the fly. Our results are the first general-case dynamic regret bounds for projection-free online learning, and can recover the existing $\mathcal{O}(T^{3/4})$ static regret by setting $P_T = 0$. Furthermore, we propose a projection-free method to attain an $\tilde{\mathcal{O}}(\tau^{3/4})$ adaptive regret bound for any interval with length $\tau$, which nearly matches the static regret over that interval. The essential idea is to maintain a set of $\text{BOGD}_\text{IP}$ algorithms dynamically, and combine them by a meta algorithm. Moreover, we demonstrate that it is also equipped with an $\mathcal{O}(T^{3/4}(1+P_T)^{1/4})$ dynamic regret bound. Finally, empirical studies verify our theoretical findings.

arxiv情報

著者 Yibo Wang,Wenhao Yang,Wei Jiang,Shiyin Lu,Bing Wang,Haihong Tang,Yuanyu Wan,Lijun Zhang
発行日 2023-05-19 15:02:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク