Perfect Information Monte Carlo with Postponing Reasoning

要約

Bridge や Skat などの不完全情報ゲームでは、状態空間の爆発や隠された情報による課題が生じ、検索アルゴリズムにとって大きな障害となります。
決定ベースのアルゴリズムは、隠れた情報をサンプリングし、完璧な情報設定でゲームを解決することで解決策を提供し、迅速かつ効果的な行動推定を容易にします。
ただし、完全情報への移行には、特に戦略融合と呼ばれる課題が伴います。この研究では、最先端の決定ベースのアプローチである完全情報モンテカルロにヒントを得たオンライン アルゴリズムである「拡張完全情報モンテカルロ」(EPIMC) が導入されています。
(PIMC)。
EPIMC は、完全な情報解決を延期することで PIMC の機能を強化し、戦略融合に関連する問題の軽減を軽減します。
ただし、リーフ評価を延期するという決定により、以前のレベルの推論と新たに延期された解決策との間の相互作用など、新たな考慮事項が導入されます。
私たちの実証分析では、さまざまなゲームにおける EPIMC のパフォーマンスを調査し、特にさまざまな程度の戦略融合を特徴とするゲームに焦点を当てています。
私たちの結果は、特に戦略の融合がゲームプレイに大きな影響を与えるゲームにおいて、顕著なパフォーマンスの向上を示しています。
さらに、私たちの研究は、戦略融合に関連する課題に対処する決定ベースのアルゴリズムの理論的基礎に貢献し、それによって不完全な情報ゲームのシナリオの文脈におけるこれらのアルゴリズムの理解を深めます。

要約(オリジナル)

Imperfect information games, such as Bridge and Skat, present challenges due to state-space explosion and hidden information, posing formidable obstacles for search algorithms. Determinization-based algorithms offer a resolution by sampling hidden information and solving the game in a perfect information setting, facilitating rapid and effective action estimation. However, transitioning to perfect information introduces challenges, notably one called strategy fusion.This research introduces `Extended Perfect Information Monte Carlo’ (EPIMC), an online algorithm inspired by the state-of-the-art determinization-based approach Perfect Information Monte Carlo (PIMC). EPIMC enhances the capabilities of PIMC by postponing the perfect information resolution, reducing alleviating issues related to strategy fusion. However, the decision to postpone the leaf evaluator introduces novel considerations, such as the interplay between prior levels of reasoning and the newly deferred resolution. In our empirical analysis, we investigate the performance of EPIMC across a range of games, with a particular focus on those characterized by varying degrees of strategy fusion. Our results demonstrate notable performance enhancements, particularly in games where strategy fusion significantly impacts gameplay. Furthermore, our research contributes to the theoretical foundation of determinization-based algorithms addressing challenges associated with strategy fusion.%, thereby enhancing our understanding of these algorithms within the context of imperfect information game scenarios.

arxiv情報

著者 Jérôme Arjonilla,Abdallah Saffidine,Tristan Cazenave
発行日 2024-08-05 11:12:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク