要約
大規模言語モデル(LLM)は、様々なエージェント計画タスクにおいてかなりの性能を達成している。しかしながら、従来のエージェント計画アプローチは、ゴールド軌道、外部フィードバック、およびドメイン知識をエージェントモデルに無差別に注入する「洪水灌漑」手法を採用している。このやり方は、意思決定中の状況的自己認識の基本的な人間の認知原理(意思決定中に状況的要求を動的に評価し、戦略的にリソースを使用する能力)を見落としている。我々は、このギャップを解決するために、エージェント的知識自己認識を提案する。これは、LLMベースのエージェントが自律的に知識利用を制御することを可能にする新しいパラダイムである。具体的には、人間のような知識自己認識を持つエージェントを適用するデータ中心のアプローチであるKnowSelfを提案する。具体的には、学習データを収集するために、エージェントの自己探索軌跡上に特別なトークンをマークするヒューリスティックな状況判断基準を考案する。2段階の訓練プロセスにより、エージェントモデルは特定の特別なトークンを生成することで異なる状況を切り替えることができ、最小限のコストで最適な計画効果を達成することができる。我々の実験は、KnowSelfが外部知識の使用を最小限に抑えながら、様々なタスクやモデルにおいて様々な強力なベースラインを凌駕できることを実証している。コードはhttps://github.com/zjunlp/KnowSelf。
要約(オリジナル)
Large Language Models (LLMs) have achieved considerable performance across various agentic planning tasks. However, traditional agent planning approaches adopt a ‘flood irrigation’ methodology that indiscriminately injects gold trajectories, external feedback, and domain knowledge into agent models. This practice overlooks the fundamental human cognitive principle of situational self-awareness during decision-making-the ability to dynamically assess situational demands and strategically employ resources during decision-making. We propose agentic knowledgeable self-awareness to address this gap, a novel paradigm enabling LLM-based agents to autonomously regulate knowledge utilization. Specifically, we propose KnowSelf, a data-centric approach that applies agents with knowledgeable self-awareness like humans. Concretely, we devise a heuristic situation judgement criterion to mark special tokens on the agent’s self-explored trajectories for collecting training data. Through a two-stage training process, the agent model can switch between different situations by generating specific special tokens, achieving optimal planning effects with minimal costs. Our experiments demonstrate that KnowSelf can outperform various strong baselines on different tasks and models with minimal use of external knowledge. Code is available at https://github.com/zjunlp/KnowSelf.
arxiv情報
著者 | Shuofei Qiao,Zhisong Qiu,Baochang Ren,Xiaobin Wang,Xiangyuan Ru,Ningyu Zhang,Xiang Chen,Yong Jiang,Pengjun Xie,Fei Huang,Huajun Chen |
発行日 | 2025-04-04 16:03:38+00:00 |
arxivサイト | arxiv_id(pdf) |