要約
人間は道具を作成し利用する並外れた能力を持っており、それによって物理的な限界を克服し、新たな境地を開拓することができます。
基礎モデルの出現により、AI システムは人間と同様にツールの使用に熟達する可能性があります。
このパラダイム、つまり基礎モデルを使用したツール学習は、専門化されたツールと基礎モデルの長所を組み合わせて、問題解決の精度、効率、自動化の向上を実現します。
その計り知れない可能性にもかかわらず、この分野における主要な課題、機会、将来の取り組みについての包括的な理解がまだ不足しています。
この目的を達成するために、本稿ではツール学習の体系的な調査を紹介します。
まず、ツール学習の認知的起源、基礎モデルのパラダイムシフト、ツールとモデルの相補的な役割など、ツール学習の背景を紹介します。
次に、ツール拡張学習とツール指向学習に関する既存のツール学習研究を要約します。
私たちは一般的なツール学習フレームワークを策定します。ユーザーの指示を理解することから始めて、モデルは複雑なタスクをいくつかのサブタスクに分解し、推論を通じて計画を動的に調整し、適切なツールを選択して各サブタスクを効果的に克服することを学習する必要があります。
また、ツールの使用能力を向上させるためにモデルをトレーニングし、ツール学習の一般化を促進する方法についても説明します。
以前の研究では体系的なツール学習評価が欠如していたことを考慮して、18 の代表的なツールを実験し、ツールを巧みに活用する際の現在の基礎モデルの可能性を示します。
最後に、ツール学習のためにさらなる調査が必要ないくつかの未解決の問題について説明します。
一般に、この論文がツールと基礎モデルの統合に関する将来の研究にインスピレーションを与えることができれば幸いです。
要約(オリジナル)
Humans possess an extraordinary ability to create and utilize tools, allowing them to overcome physical limitations and explore new frontiers. With the advent of foundation models, AI systems have the potential to be equally adept in tool use as humans. This paradigm, i.e., tool learning with foundation models, combines the strengths of specialized tools and foundation models to achieve enhanced accuracy, efficiency, and automation in problem-solving. Despite its immense potential, there is still a lack of a comprehensive understanding of key challenges, opportunities, and future endeavors in this field. To this end, we present a systematic investigation of tool learning in this paper. We first introduce the background of tool learning, including its cognitive origins, the paradigm shift of foundation models, and the complementary roles of tools and models. Then we recapitulate existing tool learning research into tool-augmented and tool-oriented learning. We formulate a general tool learning framework: starting from understanding the user instruction, models should learn to decompose a complex task into several subtasks, dynamically adjust their plan through reasoning, and effectively conquer each sub-task by selecting appropriate tools. We also discuss how to train models for improved tool-use capabilities and facilitate the generalization in tool learning. Considering the lack of a systematic tool learning evaluation in prior works, we experiment with 18 representative tools and show the potential of current foundation models in skillfully utilizing tools. Finally, we discuss several open problems that require further investigation for tool learning. In general, we hope this paper could inspire future research in integrating tools with foundation models.
arxiv情報
著者 | Yujia Qin,Shengding Hu,Yankai Lin,Weize Chen,Ning Ding,Ganqu Cui,Zheni Zeng,Yufei Huang,Chaojun Xiao,Chi Han,Yi Ren Fung,Yusheng Su,Huadong Wang,Cheng Qian,Runchu Tian,Kunlun Zhu,Shihao Liang,Xingyu Shen,Bokai Xu,Zhen Zhang,Yining Ye,Bowen Li,Ziwei Tang,Jing Yi,Yuzhang Zhu,Zhenning Dai,Lan Yan,Xin Cong,Yaxi Lu,Weilin Zhao,Yuxiang Huang,Junxi Yan,Xu Han,Xian Sun,Dahai Li,Jason Phang,Cheng Yang,Tongshuang Wu,Heng Ji,Zhiyuan Liu,Maosong Sun |
発行日 | 2024-08-06 15:14:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google