Ordinal Potential-based Player Rating

要約

純粋な戦略 $x$、$y$、$z$ の場合、$x$ が $y$ より優れており、$y$ が $z$ より優れている場合、2 人のプレイヤーの対称ゼロサム ゲームは推移的です。
その場合、$x$ は $z$ よりも優れています。
最近、Elo レーティングが戦略間の推移的な関係を維持することに失敗し、そのためゲームの推移的なコンポーネントを正しく抽出できないことが観察されました。
私たちの最初の貢献は、適切な空間で計算された場合、Elo 評価が実際に推移性を維持することを示すことです。
正確には、適切な可逆マッピング $\varphi$ を使用して、まず $\varphi$ をゲームに適用し、次に Elo 評価を計算し、次に $\varphi^{-1}$ を適用して元の空間に戻ります。
我々は、加法分離可能なポテンシャル関数を持つ順序ポテンシャル ゲームの弱い変形として推移的ゲームの特徴付けを提供します。
この洞察を活用して、推移性順序の概念、つまり推移性ゲームの利得をその潜在的な関数 (の差) に変換するために必要な可逆マッピングの最小数を導入します。
推移性順序は推移性ゲームを分類するツールであり、Elo ゲームは次数 1 の推移性ゲームの例です。
現実世界のほとんどのゲームには推移的コンポーネントと非推移的 (周期的) コンポーネントの両方があり、推移性の分析を使用して、任意のゲームの推移的 (潜在的な) コンポーネントを抽出します。
推移性を符号ランクの既知の概念に関連付けます。推移的ゲームには符号ランク 2 があります。
任意のゲームのサインランクが高くなる可能性があります。
ニューラル ネットワーク ベースのアーキテクチャを使用して、ゲームの符号パターンの捕捉を優先する、任意のゲームの推移的コンポーネントと周期的コンポーネントへの分解を学習します。
特に、推移的ゲームの分解には常に 1 つのコンポーネント (潜在的なコンポーネント) が含まれます。
私たちは、おもちゃの例と現実世界のゲームからの経験的データの両方を使用して、方法論の包括的な評価を提供します。

要約(オリジナル)

A two-player symmetric zero-sum game is transitive if for any pure strategies $x$, $y$, $z$, if $x$ is better than $y$, and $y$ is better than $z$, then $x$ is better than $z$. It was recently observed that the Elo rating fails at preserving transitive relations among strategies and therefore cannot correctly extract the transitive component of a game. Our first contribution is to show that the Elo rating actually does preserve transitivity when computed in the right space. Precisely, using a suitable invertible mapping $\varphi$, we first apply $\varphi$ to the game, then compute Elo ratings, then go back to the original space by applying $\varphi^{-1}$. We provide a characterization of transitive games as a weak variant of ordinal potential games with additively separable potential functions. Leveraging this insight, we introduce the concept of transitivity order, the minimum number of invertible mappings required to transform the payoff of a transitive game into (differences of) its potential function. The transitivity order is a tool to classify transitive games, with Elo games being an example of transitive games of order one. Most real-world games have both transitive and non-transitive (cyclic) components, and we use our analysis of transitivity to extract the transitive (potential) component of an arbitrary game. We link transitivity to the known concept of sign-rank: transitive games have sign-rank two; arbitrary games may have higher sign-rank. Using a neural network-based architecture, we learn a decomposition of an arbitrary game into transitive and cyclic components that prioritises capturing the sign pattern of the game. In particular, a transitive game always has just one component in its decomposition, the potential component. We provide a comprehensive evaluation of our methodology using both toy examples and empirical data from real-world games.

arxiv情報

著者 Nelson Vadori,Rahul Savani
発行日 2023-06-08 17:08:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG パーマリンク