Fast swap regret minimization and applications to approximate correlated equilibria

要約

任意の定数 $\varepsilon>0$ に対して、$T = \mathsf{polylog}(n)$ ラウンドのみで $\varepsilon T$-swap リグアロングを取得する、シンプルで計算効率の高いアルゴリズムを提供します。
これは、最先端のアルゴリズムで必要とされる超線形のラウンド数と比較すると指数関数的な改善であり、[Blum and Mansour 2007] の主要な未解決の問題を解決します。
私たちのアルゴリズムは $\varepsilon$ に指数関数的に依存しますが、一致する新しい下限を証明します。
私たちのスワップ リグレスのアルゴリズムは、いくつかの体制における $\varepsilon$-相関均衡 ($\varepsilon$-CE) へのより速い収束を意味します。 $n$ アクションを伴う通常形式の 2 人プレイ ゲームの場合、次のように収束する最初の非共役ダイナミクスを意味します。
多対数丸めの $\varepsilon$-CE のセット。
2 人用ゲームにおける $\varepsilon$-CE 用の $\mathsf{polylog}(n)$ ビット通信プロトコル ([Babichenko-Rubinstein’2017、Goos-Rubinstein’2018、Ganor-CS で言及された未解決の問題を解決)
‘2018]);
$\varepsilon$-CE の $\tilde{O}(n)$-クエリ アルゴリズム ([Babichenko’2020] の未解決の問題を解決し、$\varepsilon$-CE と $\varepsilon$ の間の最初の分離を取得)
-クエリ複雑さモデルにおけるナッシュ均衡)。
拡張形式のゲームの場合、私たちのアルゴリズムは $\mathit{normal}$ $\mathit{form}$ $\mathit{correlation}$ $\mathit{equilibria}$ の PTAS を意味します。これは、計算的に扱いにくいとよく推測される解決概念です。
(例: [Stengel-Forges’08、Fujii’23])。

要約(オリジナル)

We give a simple and computationally efficient algorithm that, for any constant $\varepsilon>0$, obtains $\varepsilon T$-swap regret within only $T = \mathsf{polylog}(n)$ rounds; this is an exponential improvement compared to the super-linear number of rounds required by the state-of-the-art algorithm, and resolves the main open problem of [Blum and Mansour 2007]. Our algorithm has an exponential dependence on $\varepsilon$, but we prove a new, matching lower bound. Our algorithm for swap regret implies faster convergence to $\varepsilon$-Correlated Equilibrium ($\varepsilon$-CE) in several regimes: For normal form two-player games with $n$ actions, it implies the first uncoupled dynamics that converges to the set of $\varepsilon$-CE in polylogarithmic rounds; a $\mathsf{polylog}(n)$-bit communication protocol for $\varepsilon$-CE in two-player games (resolving an open problem mentioned by [Babichenko-Rubinstein’2017, Goos-Rubinstein’2018, Ganor-CS’2018]); and an $\tilde{O}(n)$-query algorithm for $\varepsilon$-CE (resolving an open problem of [Babichenko’2020] and obtaining the first separation between $\varepsilon$-CE and $\varepsilon$-Nash equilibrium in the query complexity model). For extensive-form games, our algorithm implies a PTAS for $\mathit{normal}$ $\mathit{form}$ $\mathit{correlated}$ $\mathit{equilibria}$, a solution concept often conjectured to be computationally intractable (e.g. [Stengel-Forges’08, Fujii’23]).

arxiv情報

著者 Binghui Peng,Aviad Rubinstein
発行日 2023-11-14 17:39:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG, cs.MA パーマリンク