Optimistic Online Learning in Symmetric Cone Games

要約

最適化オンライン学習アルゴリズムにより、特に2人零和ゲームの均衡計算が大きく進歩し、$mathcal{O}(1/epsilon)$の反復複雑度で$epsilon$-鞍点に到達する。これらの進歩は、戦略がシンプレックスベクトルである正規形ゲームと、戦略がトレース1正半正定値行列である量子ゲームにおいて確立されている。我々は楽観的学習を、戦略空間が一般化されたシンプリス(対称円錐のトレースワンスライス)である2人零和ゲームのクラスである対称円錐ゲーム(SCG)に拡張する。対称円錐とは、ユークリッド・ヨルダン代数の二乗の円錐のことである。典型的な例としては、非負の正接、二次の円錐、正の半正定値行列の円錐、およびそれらの積があり、これらはすべて凸最適化の基本である。SCGは正規形ゲームと量子ゲームを統合したものであり、我々が示すように、モデリングの柔軟性が大幅に向上し、距離計量学習問題やフェルマー・ウェーバー問題などの応用をモデル化することができる。SCGにおける近似鞍点を計算するために、最適化対称円錐乗法重み更新アルゴリズムを導入し、$mathcal{O}(1/epsilon)$の反復複雑度で$epsilon$-鞍点に到達することを確立する。我々の解析は、Optimistic Follow-the-Regularized-Leaderフレームワークに基づいており、重要な技術的貢献は、トレースワンノルムに関する対称錐負のエントロピーの強い凸性の新しい証明である。

要約(オリジナル)

Optimistic online learning algorithms have led to significant advances in equilibrium computation, particularly for two-player zero-sum games, achieving an iteration complexity of $\mathcal{O}(1/\epsilon)$ to reach an $\epsilon$-saddle point. These advances have been established in normal-form games, where strategies are simplex vectors, and quantum games, where strategies are trace-one positive semidefinite matrices. We extend optimistic learning to symmetric cone games (SCGs), a class of two-player zero-sum games where strategy spaces are generalized simplices (trace-one slices of symmetric cones). A symmetric cone is the cone of squares of a Euclidean Jordan Algebra; canonical examples include the nonnegative orthant, the second-order cone, the cone of positive semidefinite matrices, and their products, all fundamental to convex optimization. SCGs unify normal-form and quantum games and, as we show, offer significantly greater modeling flexibility, allowing us to model applications such as distance metric learning problems and the Fermat-Weber problem. To compute approximate saddle points in SCGs, we introduce the Optimistic Symmetric Cone Multiplicative Weights Update algorithm and establish an iteration complexity of $\mathcal{O}(1/\epsilon)$ to reach an $\epsilon$-saddle point. Our analysis builds on the Optimistic Follow-the-Regularized-Leader framework, with a key technical contribution being a new proof of the strong convexity of the symmetric cone negative entropy with respect to the trace-one norm, a result that may be of independent interest.

arxiv情報

著者 Anas Barakat,Wayne Lin,John Lazarsfeld,Antonios Varvitsiotis
発行日 2025-04-04 16:59:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.GT, cs.LG, math.OC パーマリンク