Voyager: An Open-Ended Embodied Agent with Large Language Models

要約

Voyager は、人間の介入なしに継続的に世界を探索し、多様なスキルを獲得し、新しい発見を行う、Minecraft 初の LLM を利用した身体化された生涯学習エージェントです。
Voyager は 3 つの重要なコンポーネントで構成されています。1) 探索を最大限に高める自動カリキュラム、2) 複雑な動作を保存および取得するための実行可能コードの成長を続けるスキル ライブラリ、3) 環境フィードバック、実行エラー、
プログラム改善のための自己検証。
Voyager はブラックボックス クエリを介して GPT-4 と対話し、モデル パラメーターの微調整の必要性を回避します。
ボイジャーによって開発されたスキルは、時間的に拡張され、解釈可能で、構成可能であり、エージェントの能力を急速に強化し、致命的な忘却を軽減します。
経験的に、Voyager は状況に応じた強力な生涯学習能力を示し、Minecraft のプレイにおいて並外れた熟練度を示します。
以前の SOTA よりも 3.3 倍多くのユニークなアイテムを取得し、2.3 倍の長距離を移動し、主要な技術ツリーのマイルストーンを最大 15.3 倍の速さでアンロックします。
Voyager は、学習したスキル ライブラリを新しい Minecraft ワールドで利用して、斬新なタスクをゼロから解決することができますが、他のテクニックは一般化するのに苦労しています。
私たちは完全なコードベースとプロンプトを https://voyager.minedojo.org/ でオープンソース化しています。

要約(オリジナル)

We introduce Voyager, the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention. Voyager consists of three key components: 1) an automatic curriculum that maximizes exploration, 2) an ever-growing skill library of executable code for storing and retrieving complex behaviors, and 3) a new iterative prompting mechanism that incorporates environment feedback, execution errors, and self-verification for program improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses the need for model parameter fine-tuning. The skills developed by Voyager are temporally extended, interpretable, and compositional, which compounds the agent’s abilities rapidly and alleviates catastrophic forgetting. Empirically, Voyager shows strong in-context lifelong learning capability and exhibits exceptional proficiency in playing Minecraft. It obtains 3.3x more unique items, travels 2.3x longer distances, and unlocks key tech tree milestones up to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill library in a new Minecraft world to solve novel tasks from scratch, while other techniques struggle to generalize. We open-source our full codebase and prompts at https://voyager.minedojo.org/.

arxiv情報

著者 Guanzhi Wang,Yuqi Xie,Yunfan Jiang,Ajay Mandlekar,Chaowei Xiao,Yuke Zhu,Linxi Fan,Anima Anandkumar
発行日 2023-10-19 16:27:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク