Fast and Knowledge-Free Deep Learning for General Game Playing (Student Abstract)

要約

私たちは、より高速なモデル生成に焦点を当て、ゲーム ルールから抽出する知識を少なくすることに重点を置き、AlphaZero モデルを一般ゲーム プレイング (GGP) に適応させる方法を開発しました。
データセットの生成では、自己再生ではなく MCTS 再生が使用されます。
値ネットワークのみが使用され、畳み込みレイヤーはアテンション レイヤーに置き換えられます。
これにより、アクション スペースとボード トポロジに関する仮定を放棄することができます。
このメソッドを Regular Boardgames GGP システム内に実装し、ほとんどのゲームで UCT ベースラインを上回るパフォーマンスのモデルを効率的に構築できることを示します。

要約(オリジナル)

We develop a method of adapting the AlphaZero model to General Game Playing (GGP) that focuses on faster model generation and requires less knowledge to be extracted from the game rules. The dataset generation uses MCTS playing instead of self-play; only the value network is used, and attention layers replace the convolutional ones. This allows us to abandon any assumptions about the action space and board topology. We implement the method within the Regular Boardgames GGP system and show that we can build models outperforming the UCT baseline for most games efficiently.

arxiv情報

著者 Michał Maras,Michał Kępa,Jakub Kowalski,Marek Szykuła
発行日 2023-12-21 18:44:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク