Bounded rationality for relaxing best response and mutual consistency: The Quantal Hierarchy model of decision-making

要約

ゲーム理論は意思決定に変革をもたらしてきましたが、特定の例では、仮定が過度に制限される可能性があります。
この作業では、相互の一貫性や最良の反応など、合理性の根底にある仮定のいくつかを調査し、レベル $k$ の推論と量子反応均衡 (QRE) の概念を使用してこれらの仮定を緩和する方法を検討します。
具体的には、Quantal Hierarchy モデルと呼ばれる情報理論的な 2 パラメーター モデルを提案します。このモデルは、相互の一貫性と最良の応答の両方を緩和しながら、限定的なケースでレベル $k$、QRE、または典型的なナッシュ均衡の動作を近似することができます。
このモデルは、変分自由エネルギー原理の再帰的な形式に基づいており、拡張形式のゲーム ツリーでの (疑似) 逐次的意思決定として高次の推論を表しています。
この表現により、ゲームツリー全体で推論リソースが枯渇する連続ゲームと同様の方法で同時ゲームを扱うことができます。
プレーヤーの処理能力の限界は、情報コストとして捉えられ、将来の推論の分岐が割り引かれ、低レベルのプレーヤーがより少ない処理リソースを持つプレーヤーの階層を意味します。
サンプル外モデリングを使用して、{同時および逐次の両方の}いくつかの標準的な経済ゲームにおける量子階層モデルの有効性を示します。

要約(オリジナル)

While game theory has been transformative for decision-making, the assumptions made can be overly restrictive in certain instances. In this work, we investigate some of the underlying assumptions of rationality, such as mutual consistency and best response, and consider ways to relax these assumptions using concepts from level-$k$ reasoning and quantal response equilibrium (QRE) respectively. Specifically, we propose an information-theoretic two-parameter model called the Quantal Hierarchy model, which can relax both mutual consistency and best response while still approximating level-$k$, QRE, or typical Nash equilibrium behaviour in the limiting cases. The model is based on a recursive form of the variational free energy principle, representing higher-order reasoning as (pseudo) sequential decision-making in extensive-form game tree. This representation enables us to treat simultaneous games in a similar manner to sequential games, where reasoning resources deplete throughout the game-tree. Bounds in player processing abilities are captured as information costs, where future branches of reasoning are discounted, implying a hierarchy of players where lower-level players have fewer processing resources. We demonstrate the effectiveness of the Quantal Hierarchy model in several canonical economic games, {both simultaneous and sequential}, using out-of-sample modelling.

arxiv情報

著者 Benjamin Patrick Evans,Mikhail Prokopenko
発行日 2023-03-15 11:02:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.IT, econ.GN, math.IT, q-fin.EC パーマリンク