要約
人類は長い間、人間のレベルと同等またはそれを超える人工知能 (AI) を追求してきましたが、AI エージェントはこの追求の有望な手段と考えられています。
AI エージェントは、環境を感知し、意思決定を行い、行動を起こす人工的な存在です。
インテリジェントエージェントを開発するために多くの努力がなされてきましたが、それらは主に、特定のタスクにおける特定の能力やパフォーマンスを強化するためのアルゴリズムやトレーニング戦略の進歩に焦点を当てています。
実際、コミュニティに欠けているのは、多様なシナリオに適応できる AI エージェントを設計するための出発点となる、一般的で強力なモデルです。
大規模言語モデル (LLM) は、その多用途な機能を実証しているため、汎用人工知能 (AGI) の潜在的な火種とみなされており、汎用 AI エージェントの構築に期待が寄せられています。
多くの研究者が AI エージェントを構築するための基盤として LLM を活用し、大きな進歩を遂げてきました。
このペーパーでは、LLM ベースのエージェントに関する包括的な調査を実行します。
まず、エージェントの概念をその哲学的起源から AI の発展まで追跡し、LLM がエージェントの基盤として適している理由を説明します。
これに基づいて、脳、知覚、動作という 3 つの主要コンポーネントで構成される LLM ベースのエージェントの一般的なフレームワークを提示します。このフレームワークはさまざまなアプリケーションに合わせて調整できます。
続いて、単一エージェントのシナリオ、マルチエージェントのシナリオ、および人間とエージェントの協力という 3 つの側面で、LLM ベースのエージェントの広範なアプリケーションを調査します。
これに続いて、エージェント社会を掘り下げ、LLM ベースのエージェントの行動と性格、エージェント社会から現れる社会現象、およびエージェント社会が人間社会に提供する洞察を探ります。
最後に、いくつかの重要なトピックと、この分野における未解決の問題について説明します。
関連論文のリポジトリ (https://github.com/WooooDyy/LLM-Agent-Paper-List)。
要約(オリジナル)
For a long time, humanity has pursued artificial intelligence (AI) equivalent to or surpassing the human level, with AI agents considered a promising vehicle for this pursuit. AI agents are artificial entities that sense their environment, make decisions, and take actions. Many efforts have been made to develop intelligent agents, but they mainly focus on advancement in algorithms or training strategies to enhance specific capabilities or performance on particular tasks. Actually, what the community lacks is a general and powerful model to serve as a starting point for designing AI agents that can adapt to diverse scenarios. Due to the versatile capabilities they demonstrate, large language models (LLMs) are regarded as potential sparks for Artificial General Intelligence (AGI), offering hope for building general AI agents. Many researchers have leveraged LLMs as the foundation to build AI agents and have achieved significant progress. In this paper, we perform a comprehensive survey on LLM-based agents. We start by tracing the concept of agents from its philosophical origins to its development in AI, and explain why LLMs are suitable foundations for agents. Building upon this, we present a general framework for LLM-based agents, comprising three main components: brain, perception, and action, and the framework can be tailored for different applications. Subsequently, we explore the extensive applications of LLM-based agents in three aspects: single-agent scenarios, multi-agent scenarios, and human-agent cooperation. Following this, we delve into agent societies, exploring the behavior and personality of LLM-based agents, the social phenomena that emerge from an agent society, and the insights they offer for human society. Finally, we discuss several key topics and open problems within the field. A repository for the related papers at https://github.com/WooooDyy/LLM-Agent-Paper-List.
arxiv情報
著者 | Zhiheng Xi,Wenxiang Chen,Xin Guo,Wei He,Yiwen Ding,Boyang Hong,Ming Zhang,Junzhe Wang,Senjie Jin,Enyu Zhou,Rui Zheng,Xiaoran Fan,Xiao Wang,Limao Xiong,Yuhao Zhou,Weiran Wang,Changhao Jiang,Yicheng Zou,Xiangyang Liu,Zhangyue Yin,Shihan Dou,Rongxiang Weng,Wensen Cheng,Qi Zhang,Wenjuan Qin,Yongyan Zheng,Xipeng Qiu,Xuanjing Huang,Tao Gui |
発行日 | 2023-09-19 08:29:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google