要約
近年の大規模言語モデル(LLM)の進歩により、様々な逐次的意思決定タスクを実行できるAIエージェントが強化されている。しかし、LLMが十分な知識を持たないウェブナビゲーションのような不慣れな領域において、LLMを効果的に誘導することは、実演ベースの文脈内学習パラダイムでは困難であることが証明されている。本論文では、AutoGuideと呼ばれる新しいフレームワークを紹介し、オフラインの経験から文脈を考慮したガイドラインを自動的に生成することで、この限界に対処する。重要な点は、各コンテキスト認識ガイドラインは、簡潔な自然言語で表現され、条件構造に従っており、適用可能なコンテキストを明確に記述していることである。その結果、我々のガイドラインは、エージェントの現在の意思決定プロセスに関連する知識の提供を促進し、従来のデモンストレーションベースの学習パラダイムの限界を克服する。我々の評価は、AutoGuideが、実世界のウェブナビゲーションを含む複雑なベンチマークドメインにおいて、競合するベースラインを大幅に上回ることを実証している。
要約(オリジナル)
Recent advances in large language models (LLMs) have empowered AI agents capable of performing various sequential decision-making tasks. However, effectively guiding LLMs to perform well in unfamiliar domains like web navigation, where they lack sufficient knowledge, has proven to be difficult with the demonstration-based in-context learning paradigm. In this paper, we introduce a novel framework, called AutoGuide, which addresses this limitation by automatically generating context-aware guidelines from offline experiences. Importantly, each context-aware guideline is expressed in concise natural language and follows a conditional structure, clearly describing the context where it is applicable. As a result, our guidelines facilitate the provision of relevant knowledge for the agent’s current decision-making process, overcoming the limitations of the conventional demonstration-based learning paradigm. Our evaluation demonstrates that AutoGuide significantly outperforms competitive baselines in complex benchmark domains, including real-world web navigation.
arxiv情報
著者 | Yao Fu,Dong-Ki Kim,Jaekyeom Kim,Sungryull Sohn,Lajanugen Logeswaran,Kyunghoon Bae,Honglak Lee |
発行日 | 2024-12-03 07:36:47+00:00 |
arxivサイト | arxiv_id(pdf) |