RefTool: Enhancing Model Reasoning with Reference-Guided Tool Creation

要約

ツールは、複雑な問題解決タスクにおける大規模な言語モデル(LLM)の推論機能を強化しますが、すべてのタスクが利用可能なツールを持っているわけではありません。
事前定義されたツールがない場合、以前の作品は、LLMSに独自にツールを生成するよう指示することを検討しました。
ただし、このようなアプローチは、モデルの内部知識に大きく依存しており、LLMSの知識範囲を超えてドメインで失敗します。
この制限に対処するために、教科書などの構造化された外部材料を活用する自動ツール作成の参照ガイド付きフレームワークであるReftoolを提案します。
RefToolは2つのモジュールで構成されています。(1)ツール作成。これにより、LLMは参照コンテンツから実行可能ファイルツールを生成し、例示的な例を使用して検証し、それらを階層的にツールボックスに編成します。
(2)ツールの使用率。LLMSがツールボックス構造をナビゲートして、問題を解決するための適切なツールを選択および適用する。
因果関係、物理学、および化学ベンチマークに関する実験は、Reftoolが既存のツール作成とドメイン固有の推論方法を平均精度で11.3%上回ることを示していますが、費用対効率が高く、広く一般化可能です。
分析により、参考文献での接地ツールの作成が正確で忠実なツールを生成し、階層構造が効果的なツール選択を促進することが明らかになりました。
Reftoolは、LLMが知識の制限を克服できるようにし、強化された一般化可能な推論のために外部参照における接地ツールの作成の価値を実証します。

要約(オリジナル)

Tools enhance the reasoning capabilities of large language models (LLMs) in complex problem-solving tasks, but not all tasks have available tools. In the absence of predefined tools, prior works have explored instructing LLMs to generate tools on their own. However, such approaches rely heavily on the models’ internal knowledge and would fail in domains beyond the LLMs’ knowledge scope. To address this limitation, we propose RefTool, a reference-guided framework for automatic tool creation that leverages structured external materials such as textbooks. RefTool consists of two modules: (1) tool creation, where LLMs generate executable tools from reference content, validate them using illustrative examples, and organize them hierarchically into a toolbox; and (2) tool utilization, where LLMs navigate the toolbox structure to select and apply the appropriate tools to solve problems. Experiments on causality, physics, and chemistry benchmarks demonstrate that RefTool outperforms existing tool-creation and domain-specific reasoning methods by 11.3% on average accuracy, while being cost-efficient and broadly generalizable. Analyses reveal that grounding tool creation in references produces accurate and faithful tools, and that the hierarchical structure facilitates effective tool selection. RefTool enables LLMs to overcome knowledge limitations, demonstrating the value of grounding tool creation in external references for enhanced and generalizable reasoning.

arxiv情報

著者 Xiao Liu,Da Yin,Zirui Wu,Yansong Feng
発行日 2025-05-27 16:41:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク