要約
【タイトル】多人数不完全情報ゲームにおけるベイズ相手モデリング
【要約】
– 多くの現実世界の設定では、エージェントが多数の相手エージェントと戦略的交流を行い、それらはさまざまな戦略を使用できる。
– そのような設定に対するエージェントの設計の標準的なアプローチは、Nash均衡などの関連するゲーム理論的解の計算または近似を行い、指示された戦略に従うことである。
– しかし、このような戦略は、相手のプレイに関する観察を無視しており、欠点を示すことがあるため、攻撃することができない。
– 私たちは、多人数不完全情報ゲームにおける相手モデリングのアプローチを提案し、反復された交流を通じて相手のプレイの観察を収集する。
– 3人用クーンポーカーにおいて、正確なNash均衡戦略を含むさまざまな本当の相手との実験を行い、私たちのアルゴリズムがすべてのエージェント、正確なNash均衡戦略を含めて、大幅に上回ることを示した。
要約(オリジナル)
In many real-world settings agents engage in strategic interactions with multiple opposing agents who can employ a wide variety of strategies. The standard approach for designing agents for such settings is to compute or approximate a relevant game-theoretic solution concept such as Nash equilibrium and then follow the prescribed strategy. However, such a strategy ignores any observations of opponents’ play, which may indicate shortcomings that can be exploited. We present an approach for opponent modeling in multiplayer imperfect-information games where we collect observations of opponents’ play through repeated interactions. We run experiments against a wide variety of real opponents and exact Nash equilibrium strategies in three-player Kuhn poker and show that our algorithm significantly outperforms all of the agents, including the exact Nash equilibrium strategies.
arxiv情報
著者 | Sam Ganzfried,Kevin A. Wang,Max Chiswick |
発行日 | 2023-04-27 00:53:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI