Learning adaptive planning representations with natural language guidance

要約

現実世界で効果的に計画を立てるには、世界の知識だけでなく、その知識を活用して目の前のタスクを適切に表現する能力も必要です。
数十年にわたる階層型計画手法では、効率的かつ正確な計画をサポートするためにドメイン固有の時間的アクションの抽象化が使用され、ほとんどの場合、人間の事前知識とドメインの知識に依存して、困難なタスクを目標または一連の目標に適した小さなサブ問題に分解してきました。
この論文では、言語モデル (LM) からのタスク一般の背景知識を使用して、タスク固有の計画表現を自動的に構築するためのフレームワークである Ada (Action Domain Acquisition) について説明します。
Ada は、汎用の階層型プランナーと低レベルの目標条件付きポリシーから始めて、プランナーと互換性のある高レベルのアクション抽象化のライブラリと、計画タスクの特定のドメインに適応した低レベルのコントローラーを対話的に学習します。
2 つの言語ガイド付きのインタラクティブな計画ベンチマーク (Mini Minecraft と ALFRED 家事タスク) では、Ada は逐次的な意思決定に LM を使用する他のアプローチよりも優れたパフォーマンスを示し、より正確な計画と複雑なタスクに対するより適切な一般化を提供します。

要約(オリジナル)

Effective planning in the real world requires not only world knowledge, but the ability to leverage that knowledge to build the right representation of the task at hand. Decades of hierarchical planning techniques have used domain-specific temporal action abstractions to support efficient and accurate planning, almost always relying on human priors and domain knowledge to decompose hard tasks into smaller subproblems appropriate for a goal or set of goals. This paper describes Ada (Action Domain Acquisition), a framework for automatically constructing task-specific planning representations using task-general background knowledge from language models (LMs). Starting with a general-purpose hierarchical planner and a low-level goal-conditioned policy, Ada interactively learns a library of planner-compatible high-level action abstractions and low-level controllers adapted to a particular domain of planning tasks. On two language-guided interactive planning benchmarks (Mini Minecraft and ALFRED Household Tasks), Ada strongly outperforms other approaches that use LMs for sequential decision-making, offering more accurate plans and better generalization to complex tasks.

arxiv情報

著者 Lionel Wong,Jiayuan Mao,Pratyusha Sharma,Zachary S. Siegel,Jiahai Feng,Noa Korneev,Joshua B. Tenenbaum,Jacob Andreas
発行日 2023-12-13 23:35:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.RO パーマリンク