Policy Space Response Oracles: A Survey

要約

ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します。
ただし、古典的なゲーム理論分析は戦略の数が多いため拡張性に限界があり、より複雑なシナリオに直接適用することができません。
この調査は、Policy Space Response Oracles (PSRO) として知られる大規模ゲーム用のフレームワークの包括的な概要を提供します。このフレームワークは、戦略の十分なサブセットに注目することでスケーラビリティを向上させることが期待されています。
まず、PSRO に動機を与え、歴史的背景を提供します。
次に、PSRO の戦略探索問題、つまり、最小限の計算コストで元のゲームをよく表現した戦略の効果的なサブセットを組み立てるという課題に焦点を当てます。
私たちは、PSRO の効率を高めるための現在の研究の方向性を調査し、さまざまな領域にわたる PSRO の応用を探ります。
最後に、未解決の質問と今後の研究について議論します。

要約(オリジナル)

Game theory provides a mathematical way to study the interaction between multiple decision makers. However, classical game-theoretic analysis is limited in scalability due to the large number of strategies, precluding direct application to more complex scenarios. This survey provides a comprehensive overview of a framework for large games, known as Policy Space Response Oracles (PSRO), which holds promise to improve scalability by focusing attention on sufficient subsets of strategies. We first motivate PSRO and provide historical context. We then focus on the strategy exploration problem for PSRO: the challenge of assembling effective subsets of strategies that still represent the original game well with minimum computational cost. We survey current research directions for enhancing the efficiency of PSRO, and explore the applications of PSRO across various domains. We conclude by discussing open questions and future research.

arxiv情報

著者 Ariyan Bighashdel,Yongzhao Wang,Stephen McAleer,Rahul Savani,Frans A. Oliehoek
発行日 2024-05-27 16:49:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.MA パーマリンク