要約
ロボットを長期間にわたって家庭に導入すると、生涯学習に関する真の課題に直面することになります。
ユーザーに支援を提供しようとするとき、ロボットは蓄積された経験を活用して自身の知識を向上させ、より熟練したアシスタントになる必要があります。
我々は、タスクと動作計画(TAMP)のための学習の文脈における新しい生涯学習問題の定式化によってこの設定を形式化します。
TAMP システムのモジュール性を利用して、プランナー用の連続パラメーターの候補を生成する生成混合モデルを開発します。
既存の生涯学習アプローチのほとんどは、タスク モデル間でデータを共有する方法をアプリオリに決定しますが、私たちのアプローチは共有モデルと非共有モデルを学習し、各モデルの状態理解の代理として機能する補助タスクに基づいて、計画中にどれをオンラインで使用するかを決定します。
。
私たちの方法は、シミュレートされた 2D ドメインおよび BEHAVIOR ベンチマークからのいくつかの問題での計画の成功において大幅な改善を示しています。
要約(オリジナル)
A robot deployed in a home over long stretches of time faces a true lifelong learning problem. As it seeks to provide assistance to its users, the robot should leverage any accumulated experience to improve its own knowledge to become a more proficient assistant. We formalize this setting with a novel lifelong learning problem formulation in the context of learning for task and motion planning (TAMP). Exploiting the modularity of TAMP systems, we develop a generative mixture model that produces candidate continuous parameters for a planner. Whereas most existing lifelong learning approaches determine a priori how data is shared across task models, our approach learns shared and non-shared models and determines which to use online during planning based on auxiliary tasks that serve as a proxy for each model’s understanding of a state. Our method exhibits substantial improvements in planning success on simulated 2D domains and on several problems from the BEHAVIOR benchmark.
arxiv情報
著者 | Jorge A. Mendez,Leslie Pack Kaelbling,Tomás Lozano-Pérez |
発行日 | 2023-07-13 16:18:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google