Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy

要約

外交は人間社会における最も高度な活動の一つです。
複数の関係者/エージェント間の複雑なやり取りには、社会的推論、交渉術、長期戦略計画などのさまざまな能力が必要となります。
これまでの AI エージェントは、複数のエージェントが関与するタスクでマルチステップ ゲームやより大きなアクション スペースを処理できる能力を証明してきました。
しかし、外交には、特に必要な交渉段階を考慮すると、驚くほど広範な意思決定の余地が伴います。
最近、LLM エージェントは、いくつかのアプリケーションで以前のエージェントの境界を拡張する可能性を示していますが、複雑なマルチエージェント環境で非常に長い計画期間を処理するにはまだ十分ではありません。
最先端の LLM テクノロジーを活用した私たちは、より強力な LLM ベースの社会エージェントのための 3 つの核となる重要な機能を組み合わせることにより、このような高度に包括的なマルチエージェントのミッションにおいて、人間のようなエージェントに向けた AI の上限を探索する最初の試みを行います。
記憶と反省を備えた戦略的プランナー。
2) 社会的推論に基づいて目標指向で交渉する。
3) 自動プレイ ゲームによって記憶を増強し、人間が関与することなく自己進化します。

要約(オリジナル)

Diplomacy is one of the most sophisticated activities in human society. The complex interactions among multiple parties/ agents involve various abilities like social reasoning, negotiation arts, and long-term strategy planning. Previous AI agents surely have proved their capability of handling multi-step games and larger action spaces on tasks involving multiple agents. However, diplomacy involves a staggering magnitude of decision spaces, especially considering the negotiation stage required. Recently, LLM agents have shown their potential for extending the boundary of previous agents on a couple of applications, however, it is still not enough to handle a very long planning period in a complex multi-agent environment. Empowered with cutting-edge LLM technology, we make the first stab to explore AI’s upper bound towards a human-like agent for such a highly comprehensive multi-agent mission by combining three core and essential capabilities for stronger LLM-based societal agents: 1) strategic planner with memory and reflection; 2) goal-oriented negotiate with social reasoning; 3) augmenting memory by self-play games to self-evolving without any human in the loop.

arxiv情報

著者 Zhenyu Guan,Xiangyu Kong,Fangwei Zhong,Yizhou Wang
発行日 2024-10-09 17:57:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, cs.SI パーマリンク