要約
大規模な言語モデルを利用したエージェントは、複雑なタスクを解決する際に優れた能力を示しています。
ただし、ほとんどのエージェント システムは事後対応型のままであり、先見性と自律的な意思決定が必要なシナリオでは有効性が制限されます。
この論文では、人間による明示的な指示がなくても、タスクを予測して開始できるプロアクティブなエージェントを開発するという課題に取り組みます。
私たちは、この問題に対して新しいデータ駆動型のアプローチを提案します。
まず、現実世界の人間の活動を収集して、プロアクティブなタスク予測を生成します。
これらの予測は、ヒューマン アノテーターによって受け入れられたか拒否されたかのラベルが付けられます。
ラベル付きデータは、人間の判断をシミュレートし、LLM エージェントの積極性の自動評価器として機能する報酬モデルをトレーニングするために使用されます。
これに基づいて、包括的なデータ生成パイプラインを開発し、6,790 のイベントを含む多様なデータセット ProactiveBench を作成します。
最後に、提案された ProactiveBench を使用してモデルを微調整すると、LLM エージェントの積極性を大幅に引き出すことができることを示します。
実験結果によると、私たちの微調整されたモデルは、積極的な支援の提供において 66.47% の F1 スコアを達成し、すべてのオープンソースおよびクローズソース モデルを上回るパフォーマンスを示しました。
これらの結果は、よりプロアクティブで効果的なエージェント システムを作成する際の私たちの手法の可能性を強調し、人間とエージェントのコラボレーションにおける将来の進歩への道を切り開きます。
要約(オリジナル)
Agents powered by large language models have shown remarkable abilities in solving complex tasks. However, most agent systems remain reactive, limiting their effectiveness in scenarios requiring foresight and autonomous decision-making. In this paper, we tackle the challenge of developing proactive agents capable of anticipating and initiating tasks without explicit human instructions. We propose a novel data-driven approach for this problem. Firstly, we collect real-world human activities to generate proactive task predictions. These predictions are then labeled by human annotators as either accepted or rejected. The labeled data is used to train a reward model that simulates human judgment and serves as an automatic evaluator of the proactiveness of LLM agents. Building on this, we develop a comprehensive data generation pipeline to create a diverse dataset, ProactiveBench, containing 6,790 events. Finally, we demonstrate that fine-tuning models with the proposed ProactiveBench can significantly elicit the proactiveness of LLM agents. Experimental results show that our fine-tuned model achieves an F1-Score of 66.47% in proactively offering assistance, outperforming all open-source and close-source models. These results highlight the potential of our method in creating more proactive and effective agent systems, paving the way for future advancements in human-agent collaboration.
arxiv情報
著者 | Yaxi Lu,Shenzhi Yang,Cheng Qian,Guirong Chen,Qinyu Luo,Yesai Wu,Huadong Wang,Xin Cong,Zhong Zhang,Yankai Lin,Weiwen Liu,Yasheng Wang,Zhiyuan Liu,Fangming Liu,Maosong Sun |
発行日 | 2024-11-27 10:14:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google