SwarmBrain: Embodied agent for real-time strategy game StarCraft II via large language models


大規模言語モデル (LLM) は最近、さまざまな探索タスクで重要な成果を上げており、歴史的にエージェント ベースの分野を支配してきた従来の強化学習ベースの手法のパフォーマンスをも上回っています。
このペーパーの目的は、StarCraft II ゲーム環境内でリアルタイム戦略戦争タスクを実行する際の LLM の有効性を調査することです。
このペーパーでは、StarCraft II ゲーム環境でリアルタイム戦略を実装するために LLM を活用する具体化エージェントである SwarmBrain を紹介します。
SwarmBrain は 2 つの主要なコンポーネントで構成されます。 1) 最先端の LLM を活用した Overmind Intelligence Matrix は、高レベルの観点からマクロレベルの戦略を調整するように設計されています。
2) Swarm ReflexNet。これは、オーバーマインド インテリジェンス マトリックスの計算された熟慮に対応する機敏な機能です。
LLM 推論には固有の遅延があるため、Swarm ReflexNet は条件応答ステート マシン フレームワークを採用し、基本的なザーグ ユニットの機動に対する迅速な戦術応答を可能にします。
実験設定では、SwarmBrain が Zerg 種族を制御し、コンピューター制御の Terran の敵と対決します。
実験結果は、SwarmBrain が経済拡大、領土拡大、戦術策定を行う能力を示しており、SwarmBrain がさまざまな難易度に設定されたコンピューター プレイヤーに対して勝利を収めることができることを示しています。


Large language models (LLMs) have recently garnered significant accomplishments in various exploratory tasks, even surpassing the performance of traditional reinforcement learning-based methods that have historically dominated the agent-based field. The purpose of this paper is to investigate the efficacy of LLMs in executing real-time strategy war tasks within the StarCraft II gaming environment. In this paper, we introduce SwarmBrain, an embodied agent leveraging LLM for real-time strategy implementation in the StarCraft II game environment. The SwarmBrain comprises two key components: 1) a Overmind Intelligence Matrix, powered by state-of-the-art LLMs, is designed to orchestrate macro-level strategies from a high-level perspective. This matrix emulates the overarching consciousness of the Zerg intelligence brain, synthesizing strategic foresight with the aim of allocating resources, directing expansion, and coordinating multi-pronged assaults. 2) a Swarm ReflexNet, which is agile counterpart to the calculated deliberation of the Overmind Intelligence Matrix. Due to the inherent latency in LLM reasoning, the Swarm ReflexNet employs a condition-response state machine framework, enabling expedited tactical responses for fundamental Zerg unit maneuvers. In the experimental setup, SwarmBrain is in control of the Zerg race in confrontation with an Computer-controlled Terran adversary. Experimental results show the capacity of SwarmBrain to conduct economic augmentation, territorial expansion, and tactical formulation, and it shows the SwarmBrain is capable of achieving victory against Computer players set at different difficulty levels.


著者 Xiao Shao,Weifu Jiang,Fei Zuo,Mengqing Liu
発行日 2024-01-31 11:14:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク