要約
抽象的な状態表現と知識を学ぶことは、長期的なロボット計画にとって非常に重要です。
我々は、ロボットが身体化されたインタラクション中に人間の非専門家の言語フィードバックから記号述語を学習するための、LLM を利用したフレームワークである InterPreT を紹介します。
学習された述語は環境状態の関係抽象化を提供し、アクションの前提条件と効果を捉える記号演算子の学習を容易にします。
InterPreT では、学習した述語と演算子をオンザフライで PDDL ドメインにコンパイルすることで、PDDL プランナーを使用して任意のドメイン内の目標に向けた効果的な計画を立てることができます。
シミュレートされたロボット操作ドメインと現実世界のロボット操作ドメインの両方で、InterPreT が環境ダイナミクスを支配する主要な述語と演算子を確実に明らかにすることを実証します。
これらの述語と演算子は単純なトレーニング タスクから学習しましたが、非常に複雑な新しいタスクに対する強力な一般化を示します。
最も困難な汎化設定では、InterPreT はシミュレーションで 73%、現実世界では 40% の成功率を達成し、ベースライン手法を大幅に上回りました。
要約(オリジナル)
Learning abstract state representations and knowledge is crucial for long-horizon robot planning. We present InterPreT, an LLM-powered framework for robots to learn symbolic predicates from language feedback of human non-experts during embodied interaction. The learned predicates provide relational abstractions of the environment state, facilitating the learning of symbolic operators that capture action preconditions and effects. By compiling the learned predicates and operators into a PDDL domain on-the-fly, InterPreT allows effective planning toward arbitrary in-domain goals using a PDDL planner. In both simulated and real-world robot manipulation domains, we demonstrate that InterPreT reliably uncovers the key predicates and operators governing the environment dynamics. Although learned from simple training tasks, these predicates and operators exhibit strong generalization to novel tasks with significantly higher complexity. In the most challenging generalization setting, InterPreT attains success rates of 73% in simulation and 40% in the real world, substantially outperforming baseline methods.
arxiv情報
著者 | Muzhi Han,Yifeng Zhu,Song-Chun Zhu,Ying Nian Wu,Yuke Zhu |
発行日 | 2024-05-30 07:08:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google