LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning

要約

近年、大規模な言語モデル(LLM)は、自然言語処理(NLP)の大幅な進歩を示しており、生成、理解、および再協会の強力なCAPA速度を備えています。
これらのモデルでは、教育、インテリジェントな意思決定、ゲームのアプリケーションが見つかりました。
ただし、Gomokuのゲームで戦略的計画と意思決定のためにLLMSを効果的に利用することは依然として課題です。
この研究の目的は、LLMSに基づいてGomoku AIシステムを開発し、チェスをする人間の学習プロセスをシミュレートすることです。
このシステムは、Gomoku Strat-Egiesと論理を理解して適用して、合理的な決定を下すために署名されています。
研究方法には、モデルが「ボードの読み取り」、「ルールを理解する」、「戦略を選択」、「ポジションを評価する」ことを可能にし、自己プレイと補償学習を通じてその能力を促進することが含まれます。
結果は、このアプローチにより、移動位置のSE削除が大幅に改善され、違法な位置を生成する問題が解決され、並列位置評価を通じてプロセス時間が短縮されることを示しています。
大規模な自己プレイトレーニングの後、モデルのgomokuplaying機能が顕著に強化されました。

要約(オリジナル)

In recent years, large language models (LLMs) have shown significant advancements in natural language processing (NLP), with strong capa-bilities in generation, comprehension, and rea-soning. These models have found applications in education, intelligent decision-making, and gaming. However, effectively utilizing LLMs for strategic planning and decision-making in the game of Gomoku remains a challenge. This study aims to develop a Gomoku AI system based on LLMs, simulating the human learning process of playing chess. The system is de-signed to understand and apply Gomoku strat-egies and logic to make rational decisions. The research methods include enabling the model to ‘read the board,’ ‘understand the rules,’ ‘select strategies,’ and ‘evaluate positions,’ while en-hancing its abilities through self-play and rein-forcement learning. The results demonstrate that this approach significantly improves the se-lection of move positions, resolves the issue of generating illegal positions, and reduces pro-cess time through parallel position evaluation. After extensive self-play training, the model’s Gomoku-playing capabilities have been notably enhanced.

arxiv情報

著者 Hui Wang
発行日 2025-03-27 16:52:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク