APRICOT: Active Preference Learning and Constraint-Aware Task Planning with LLMs

要約

パーソナライズされたタスクを実行する家庭用ロボットは、ユーザーの好みと環境アフォーダンスのバランスを適切にとらなければなりません。
私たちは、冷蔵庫に物を並べるなど、配置の好みが物理的な制限と衝突する、限られたスペース内での整理作業に重点を置いています。
ロボットは、少数のデモンストレーションに基づいてユーザーの好みを推測する必要があります。これは、ユーザーにとって、すべての要件を広範に定義するよりも簡単です。
最近の研究では大規模言語モデル (LLM) を使用してユーザーのデモンストレーションから好みを学習していますが、2 つの根本的な課題に直面しています。
まず、観察された 1 つの動作が複数の設定によって説明されることがよくあるため、ユーザー アクションの解釈には本質的なあいまいさが存在します。
第 2 に、環境内の幾何学的制約により、すべてのユーザー設定が実際に実現できるわけではありません。
これらの課題に対処するために、LLM ベースのベイジアン能動的優先学習と制約を意識したタスク計画を統合する新しいアプローチである APRICOT を紹介します。
APRICOT は、ユーザーに積極的に問い合わせることによって生成された設定を改良し、環境上の制約を尊重するように計画を動的に適応させます。
私たちは、多様な組織タスクのデータセットに基づいて APRICOT を評価し、現実世界のシナリオでその有効性を実証し、嗜好の満足度と計画の実現可能性の両方が大幅に向上していることを示しています。
プロジェクトの Web サイトは https://portal-cornell.github.io/apricot/ にあります。

要約(オリジナル)

Home robots performing personalized tasks must adeptly balance user preferences with environmental affordances. We focus on organization tasks within constrained spaces, such as arranging items into a refrigerator, where preferences for placement collide with physical limitations. The robot must infer user preferences based on a small set of demonstrations, which is easier for users to provide than extensively defining all their requirements. While recent works use Large Language Models (LLMs) to learn preferences from user demonstrations, they encounter two fundamental challenges. First, there is inherent ambiguity in interpreting user actions, as multiple preferences can often explain a single observed behavior. Second, not all user preferences are practically feasible due to geometric constraints in the environment. To address these challenges, we introduce APRICOT, a novel approach that merges LLM-based Bayesian active preference learning with constraint-aware task planning. APRICOT refines its generated preferences by actively querying the user and dynamically adapts its plan to respect environmental constraints. We evaluate APRICOT on a dataset of diverse organization tasks and demonstrate its effectiveness in real-world scenarios, showing significant improvements in both preference satisfaction and plan feasibility. The project website is at https://portal-cornell.github.io/apricot/

arxiv情報

著者 Huaxiaoyue Wang,Nathaniel Chin,Gonzalo Gonzalez-Pumariega,Xiangwan Sun,Neha Sunkara,Maximus Adrian Pace,Jeannette Bohg,Sanjiban Choudhury
発行日 2024-10-25 16:08:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク