StateFlow: Enhancing LLM Task-Solving through State-Driven Workflows

要約

大規模言語モデル (LLM) を使用して、複雑なタスク (一連のアクションやツールや環境との動的な対話を必要とするタスクなど) に取り組むことが注目すべき傾向です。
この論文では、LLM をステート マシンとして支援する複雑なタスク解決プロセスを概念化する、新しい LLM ベースのタスク解決パラダイムである StateFlow を提案します。
状態の適切な構築と状態遷移の定義により、StateFlow はタスク解決の進行を基礎付け、タスク解決プロセス全体を通じて LLM の応答の明確な追跡と管理を保証します。
各状態内で、StateFlow を使用すると、特定のプロンプトに従って LLM の応答を生成するだけでなく、必要に応じて外部ツールの利用も含む一連のアクションを実行できます。
状態遷移は、LLM によって行われる特定のルールまたは決定によって制御され、タスクの事前定義された StateFlow モデルを通じて動的かつ適応的に進行することが可能になります。
InterCode SQL および Bash ベンチマークの評価では、StateFlow が LLM の効率を大幅に向上させることが示されています。

要約(オリジナル)

It is a notable trend to use Large Language Models (LLMs) to tackle complex tasks, e.g., tasks that require a sequence of actions and dynamic interaction with tools and environments. In this paper, we propose StateFlow, a novel LLM-based task-solving paradigm that conceptualizes complex task-solving processes backed by LLMs as state machines. With proper construction of states and definition of state transitions, StateFlow grounds the progress of task-solving, ensuring clear tracking and management of LLMs’ responses throughout the task-solving process. Within each state, StateFlow allows execution of a series of actions, involving not only the generation of LLM’s responses guided by a specific prompt, but also the utilization of external tools as needed. State transitions are controlled by specific rules or decisions made by the LLM, allowing for a dynamic and adaptive progression through the task’s pre-defined StateFlow model. Evaluations on the InterCode SQL and Bash benchmarks show that StateFlow significantly enhances LLMs’ efficiency.

arxiv情報

著者 Yiran Wu,Tianwei Yue,Shaokun Zhang,Chi Wang,Qingyun Wu
発行日 2024-03-17 19:54:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク