Tool-Planner: Task Planning with Clusters across Multiple Tools

要約

大規模な言語モデル(LLM)は、例外的な推論能力を実証しており、さまざまな複雑な問題を解決できるようにしています。
最近、この能力はツール学習のパラダイムに適用されています。
ツール学習には、ツールの使用法とそれに対応する機能の例を提供し、LLMが計画を策定し、各ツールを呼び出して実行するプロセスを実証できるようにします。
LLMは、独立して完了できないタスクに対処でき、それにより異なるタスク全体で潜在能力を高めることができます。
ただし、このアプローチは2つの重要な課題に直面しています。
第一に、冗長エラーの修正は、不安定な計画と長い実行時間につながります。
さらに、複数のツール間で正しい計画を設計することも、ツール学習の課題です。
これらの問題に対処するために、ツールキットに基づいたタスク処理フレームワークであるツールプランナーを提案します。
ツールプレーナーグループツールは、同じ関数を備えたAPI機能に基づいてツールキットになり、LLMがさまざまなツールキットに計画を実装できるようにします。
ツールエラーが発生すると、言語モデルはツールキットに基づいてツールを再選択および調整できます。
実験は、私たちのアプローチが異なるデータセット間で高いパスと勝利率を示し、GPT-4やClaude 3などのモデルでツール学習の計画スキームを最適化し、メソッドの可能性を紹介することを示しています。
私たちのコードはhttps://github.com/oceanntwt/tool-plannerで公開されています

要約(オリジナル)

Large language models (LLMs) have demonstrated exceptional reasoning capabilities, enabling them to solve various complex problems. Recently, this ability has been applied to the paradigm of tool learning. Tool learning involves providing examples of tool usage and their corresponding functions, allowing LLMs to formulate plans and demonstrate the process of invoking and executing each tool. LLMs can address tasks that they cannot complete independently, thereby enhancing their potential across different tasks. However, this approach faces two key challenges. First, redundant error correction leads to unstable planning and long execution time. Additionally, designing a correct plan among multiple tools is also a challenge in tool learning. To address these issues, we propose Tool-Planner, a task-processing framework based on toolkits. Tool-Planner groups tools based on the API functions with the same function into a toolkit and allows LLMs to implement planning across the various toolkits. When a tool error occurs, the language model can reselect and adjust tools based on the toolkit. Experiments show that our approach demonstrates a high pass and win rate across different datasets and optimizes the planning scheme for tool learning in models such as GPT-4 and Claude 3, showcasing the potential of our method. Our code is public at https://github.com/OceannTwT/Tool-Planner

arxiv情報

著者 Yanming Liu,Xinyue Peng,Jiannan Cao,Shi Bo,Yuwei Zhang,Xuhong Zhang,Sheng Cheng,Xun Wang,Jianwei Yin,Tianyu Du
発行日 2025-02-28 07:12:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.RO パーマリンク