要約
ナッシュ均衡の概念の根本的な欠点は、その計算の難しさです。正規形ゲームでナッシュ均衡を近似するのは PPAD が困難です。
この論文では、平滑化解析のアイデアに触発されて、平滑度パラメータ $\sigma$ に対して $\sigma$-smooth Nash equilibrium と呼ばれるナッシュ均衡の緩和版を導入します。
$\sigma$-smooth ナッシュ均衡では、プレイヤーは $\sigma$-smooth 戦略への最良の偏差以上のユーティリティを達成するだけで済みます。これは、(次のようにパラメータ化されているように)あまり多くの質量を置かない分布です。
$\sigma$) を固定アクションに適用します。
$\sigma$-smooth ナッシュ均衡の 2 つの変種を区別します。1 つは、プレイヤーが均衡プレイの下で $\sigma$-smooth 戦略をプレイする必要がある強い $\sigma$-smooth ナッシュ均衡、もう 1 つは弱い $\sigma$-smooth です。
ナッシュ均衡では、そのような要件はありません。
弱い$\sigma$-滑らかなナッシュ均衡と強い$\sigma$-滑らかなナッシュ均衡の両方が、ナッシュ均衡よりも優れた計算特性を持っていることを示します。$\sigma$、近似パラメーター$\epsilon$、プレーヤーの数がすべて定数の場合、
正規形ゲームで弱い $\epsilon$-近似 $\sigma$-滑らかなナッシュ均衡を見つけるための定数時間ランダム化アルゴリズム。
同じパラメータ領域では、正規形ゲームで強力な $\epsilon$-近似 $\sigma$-滑らかなナッシュ均衡を見つけるための多項式時間決定論的アルゴリズムがあります。
これらの結果は、準多項式時間より速く実行できない $\epsilon$ 近似ナッシュ均衡を計算するための最適なアルゴリズムとは対照的です。
$\sigma$ または $\epsilon$ が逆多項式の場合、弱い $\epsilon$ 近似 $\sigma$ 滑らかなナッシュ均衡を見つけることが計算上困難になることを示すことで、上限を補完します。
要約(オリジナル)
A fundamental shortcoming of the concept of Nash equilibrium is its computational intractability: approximating Nash equilibria in normal-form games is PPAD-hard. In this paper, inspired by the ideas of smoothed analysis, we introduce a relaxed variant of Nash equilibrium called $\sigma$-smooth Nash equilibrium, for a smoothness parameter $\sigma$. In a $\sigma$-smooth Nash equilibrium, players only need to achieve utility at least as high as their best deviation to a $\sigma$-smooth strategy, which is a distribution that does not put too much mass (as parametrized by $\sigma$) on any fixed action. We distinguish two variants of $\sigma$-smooth Nash equilibria: strong $\sigma$-smooth Nash equilibria, in which players are required to play $\sigma$-smooth strategies under equilibrium play, and weak $\sigma$-smooth Nash equilibria, where there is no such requirement. We show that both weak and strong $\sigma$-smooth Nash equilibria have superior computational properties to Nash equilibria: when $\sigma$ as well as an approximation parameter $\epsilon$ and the number of players are all constants, there is a constant-time randomized algorithm to find a weak $\epsilon$-approximate $\sigma$-smooth Nash equilibrium in normal-form games. In the same parameter regime, there is a polynomial-time deterministic algorithm to find a strong $\epsilon$-approximate $\sigma$-smooth Nash equilibrium in a normal-form game. These results stand in contrast to the optimal algorithm for computing $\epsilon$-approximate Nash equilibria, which cannot run in faster than quasipolynomial-time. We complement our upper bounds by showing that when either $\sigma$ or $\epsilon$ is an inverse polynomial, finding a weak $\epsilon$-approximate $\sigma$-smooth Nash equilibria becomes computationally intractable.
arxiv情報
著者 | Constantinos Daskalakis,Noah Golowich,Nika Haghtalab,Abhishek Shetty |
発行日 | 2023-09-21 16:22:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google