要約
最近の大規模言語モデル (LLM) は、根拠のある環境で意思決定を行うのに有望です。
ただし、LLM の事前トレーニングされた知識と環境内の実際のルールとの間の不整合により、LLM は複雑な意思決定タスクで失敗することがよくあります。
既存の手法では、コストのかかる勾配計算か、コンテキストに沿った長時間のデモンストレーションが必要です。
このペーパーでは、LLM ベースのエージェントが対話型の意思決定タスクを完了できるようにガイドするアプローチである AutoPlan を提案します。
AutoPlan は、LLM プロンプトをタスク解決計画で拡張し、反復的なエクスペリエンスの収集と反映を通じて最適化します。
私たちの実験によると、AutoPlan はコンテキスト内のデモンストレーションを使用していませんが、ALFWorld で人間が作成したデモンストレーションを使用したベースラインと同等の成功率を達成し、HotpotQA ではそれを 8% 上回るパフォーマンスを示しています。
コードは https://github.com/owaski/AutoPlan で入手できます。
要約(オリジナル)
Recent large language models (LLMs) are promising for making decisions in grounded environments. However, LLMs frequently fail in complex decision-making tasks due to the misalignment between the pre-trained knowledge in LLMs and the actual rules in the environment. Existing methods require either costly gradient computation or lengthy in-context demonstrations. In this paper, we propose AutoPlan, an approach to guide LLM-based agents to accomplish interactive decision-making tasks. AutoPlan augments the LLM prompt with a task-solving plan and optimizes it through iterative experience collection and reflection. Our experiments show that AutoPlan, though using no in-context demonstrations, achieves success rates on par with the baselines using human-written demonstrations on ALFWorld and even outperforms them by 8% on HotpotQA. The code is available at https://github.com/owaski/AutoPlan.
arxiv情報
著者 | Siqi Ouyang,Lei Li |
発行日 | 2023-10-26 16:44:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google