要約
HEXとカウンターウォーゲームは、複雑な戦略的意思決定を必要とする実際の軍事紛争の敵対的な2人のプレイヤーシミュレーションです。
クラシックボードゲームとは異なり、これらのゲームは、複雑な地形/ユニットの相互作用、ユニットのスタッキング、さまざまなサイズの大きなマップ、および数百ユニットを含む同時の移動と戦闘の決定を備えています。
このペーパーでは、信頼できる最新の強化学習アルゴリズムであるAlphazeroと再発性ニューラルネットワークの最先端の進歩を統合することにより、HEXとカウンターウォーゲームの戦略的複雑さに対処するために設計された新しいシステムを紹介します。
このシステムは、これらの特定のゲーム環境に合わせて調整された革新的な状態と行動の表現を組み込んだ既存の研究から開発された新しいニューラルネットワークアーキテクチャを利用しています。
最小限のトレーニングにより、私たちのソリューションは、典型的なシナリオで有望な結果を示しており、さまざまな地形や戦術的な状況にわたって一般化する能力を示しています。
さらに、システムがより大きなマップサイズにスケーリングする可能性を調査します。
開発されたシステムは公然とアクセスしやすく、この挑戦的なドメイン内での継続的な研究と調査を促進します。
要約(オリジナル)
Hex and Counter Wargames are adversarial two-player simulations of real military conflicts requiring complex strategic decision-making. Unlike classical board games, these games feature intricate terrain/unit interactions, unit stacking, large maps of varying sizes, and simultaneous move and combat decisions involving hundreds of units. This paper introduces a novel system designed to address the strategic complexity of Hex and Counter Wargames by integrating cutting-edge advancements in Recurrent Neural Networks with AlphaZero, a reliable modern Reinforcement Learning algorithm. The system utilizes a new Neural Network architecture developed from existing research, incorporating innovative state and action representations tailored to these specific game environments. With minimal training, our solution has shown promising results in typical scenarios, demonstrating the ability to generalize across different terrain and tactical situations. Additionally, we explore the system’s potential to scale to larger map sizes. The developed system is openly accessible, facilitating continued research and exploration within this challenging domain.
arxiv情報
著者 | Guilherme Palma,Pedro A. Santos,João Dias |
発行日 | 2025-02-19 17:52:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google