Statler: State-Maintaining Language Models for Embodied Reasoning

要約

大規模な言語モデルを採用して、インテリジェント ロボットに複雑な推論を与えることに大きな研究上の関心が寄せられています。
既存の研究は、彼らの行動や観察の履歴を推論する能力を活用することに焦点を当てています。
この論文では、大規模な言語モデルがロボット工学計画に役立つ可能性がある新しい次元を探ります。
特に、我々は、大規模な言語モデルが、多くの場合観察できない世界状態の推定を維持し、新しいアクションが取られたときにその推移を追跡するように促されるフレームワークである Statler を提案します。
次に、私たちのフレームワークは、現在の世界状態の推定に基づいて各アクションを条件付けします。
概念的に単純であるにもかかわらず、当社の Statler フレームワークは、いくつかのロボット計画タスクにおいて、競合する強力な手法 (Code-as-Policies など) を大幅に上回ります。
さらに、より困難な長期計画タスクにスケールアップできるという潜在的な利点もあります。

要約(オリジナル)

There has been a significant research interest in employing large language models to empower intelligent robots with complex reasoning. Existing work focuses on harnessing their abilities to reason about the histories of their actions and observations. In this paper, we explore a new dimension in which large language models may benefit robotics planning. In particular, we propose Statler, a framework in which large language models are prompted to maintain an estimate of the world state, which are often unobservable, and track its transition as new actions are taken. Our framework then conditions each action on the estimate of the current world state. Despite being conceptually simple, our Statler framework significantly outperforms strong competing methods (e.g., Code-as-Policies) on several robot planning tasks. Additionally, it has the potential advantage of scaling up to more challenging long-horizon planning tasks.

arxiv情報

著者 Takuma Yoneda,Jiading Fang,Peng Li,Huanyu Zhang,Tianchong Jiang,Shengjie Lin,Ben Picker,David Yunis,Hongyuan Mei,Matthew R. Walter
発行日 2024-05-20 05:57:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.RO パーマリンク