Online Saddle Point Problem and Online Convex-Concave Optimization

要約

このペーパーでは、オンライン サドル ポイント問題の解決を中心に、オンライン凸凹最適化 (OCCO) フレームワークを紹介します。このフレームワークには、2 人用の時間変化する凸凹ゲームのシーケンスが含まれます。
我々は、パフォーマンス指標として一般化双対性ギャップ (Dual-Gap) を提案し、Dual-Gap を備えた OCCO と残念ながら Online Convex Optimization (OCO) との間の並列関係を確立します。
OCO からの OCCO の自然な拡張を実証するために、暗黙的なオンライン ミラー降下上昇アルゴリズムとその楽観的バリアントの 2 つのアルゴリズムを開発しました。
分析の結果、それらの二重性のギャップは、OCO の暗黙的な更新から生じる対応する動的リグレスと同様の表現形式を共有していることが明らかになりました。
経験的な結果により、アルゴリズムの有効性がさらに実証されています。
同時に、最近の論文で最初に紹介された動的ナッシュ均衡の後悔には固有の欠陥があることを明らかにします。

要約(オリジナル)

Centered around solving the Online Saddle Point problem, this paper introduces the Online Convex-Concave Optimization (OCCO) framework, which involves a sequence of two-player time-varying convex-concave games. We propose the generalized duality gap (Dual-Gap) as the performance metric and establish the parallel relationship between OCCO with Dual-Gap and Online Convex Optimization (OCO) with regret. To demonstrate the natural extension of OCCO from OCO, we develop two algorithms, the implicit online mirror descent-ascent and its optimistic variant. Analysis reveals that their duality gaps share similar expression forms with the corresponding dynamic regrets arising from implicit updates in OCO. Empirical results further substantiate the effectiveness of our algorithms. Simultaneously, we unveil that the dynamic Nash equilibrium regret, which was initially introduced in a recent paper, has inherent defects.

arxiv情報

著者 Qing-xin Meng,Jian-wei Liu
発行日 2023-12-15 16:04:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC パーマリンク