Embodied Lifelong Learning for Task and Motion Planning

要約

ロボットを長期間にわたって家庭に導入すると、生涯学習に関する真の課題に直面することになります。
ユーザーに支援を提供しようとするとき、ロボットは蓄積された経験を活用して自身の知識と熟練度を向上させる必要があります。
私たちはこの設定を、課題と動作の計画のための生涯学習 (TAMP) の新しい定式化によって形式化し、学習者に TAMP システムの構成性を与えます。
TAMP のモジュール性を利用して、プランナー用の連続パラメーターの候補を生成する生成モデルの混合を開発します。
既存の生涯学習アプローチのほとんどは、さまざまなモデル間でデータがどのように共有されるかを先験的に決定しますが、私たちのアプローチは共有モデルと非共有モデルを学習し、各モデルの状態理解の代理として機能する補助タスクに基づいて、計画中にどれをオンラインで使用するかを決定します。

私たちの方法は、2D および BEHAVIOR ドメインでの計画の成功において (時間の経過とともにベースラインと比較して) 大幅な改善を示しています。

要約(オリジナル)

A robot deployed in a home over long stretches of time faces a true lifelong learning problem. As it seeks to provide assistance to its users, the robot should leverage any accumulated experience to improve its own knowledge and proficiency. We formalize this setting with a novel formulation of lifelong learning for task and motion planning (TAMP), which endows our learner with the compositionality of TAMP systems. Exploiting the modularity of TAMP, we develop a mixture of generative models that produces candidate continuous parameters for a planner. Whereas most existing lifelong learning approaches determine a priori how data is shared across various models, our approach learns shared and non-shared models and determines which to use online during planning based on auxiliary tasks that serve as a proxy for each model’s understanding of a state. Our method exhibits substantial improvements (over time and compared to baselines) in planning success on 2D and BEHAVIOR domains.

arxiv情報

著者 Jorge Mendez-Mendez,Leslie Pack Kaelbling,Tomás Lozano-Pérez
発行日 2023-11-06 01:56:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク