要約
大規模言語モデル (LLM) を使用して、複雑なタスク (一連のアクションやツールや環境との動的な対話を必要とするタスクなど) に取り組むことが注目すべき傾向です。
この論文では、LLM をステート マシンとして支援する複雑なタスク解決プロセスを概念化する、新しい LLM ベースのタスク解決パラダイムである StateFlow を提案します。
状態の適切な構築と状態遷移の定義により、StateFlow はタスク解決の進行を基礎付け、タスク解決プロセス全体を通じて LLM の応答の明確な追跡と管理を保証します。
各状態内で、StateFlow を使用すると、特定のプロンプトに従って LLM の応答を生成するだけでなく、必要に応じて外部ツールの利用も含む一連のアクションを実行できます。
状態遷移は、LLM によって行われる特定のルールまたは決定によって制御され、タスクの事前定義された StateFlow モデルを通じて動的かつ適応的に進行することが可能になります。
InterCode SQL および Bash ベンチマークの評価では、StateFlow が LLM の効率を大幅に向上させることが示されています。
要約(オリジナル)
It is a notable trend to use Large Language Models (LLMs) to tackle complex tasks, e.g., tasks that require a sequence of actions and dynamic interaction with tools and environments. In this paper, we propose StateFlow, a novel LLM-based task-solving paradigm that conceptualizes complex task-solving processes backed by LLMs as state machines. With proper construction of states and definition of state transitions, StateFlow grounds the progress of task-solving, ensuring clear tracking and management of LLMs’ responses throughout the task-solving process. Within each state, StateFlow allows execution of a series of actions, involving not only the generation of LLM’s responses guided by a specific prompt, but also the utilization of external tools as needed. State transitions are controlled by specific rules or decisions made by the LLM, allowing for a dynamic and adaptive progression through the task’s pre-defined StateFlow model. Evaluations on the InterCode SQL and Bash benchmarks show that StateFlow significantly enhances LLMs’ efficiency.
arxiv情報
著者 | Yiran Wu,Tianwei Yue,Shaokun Zhang,Chi Wang,Qingyun Wu |
発行日 | 2024-03-17 19:54:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google