Jointly Learning Cost and Constraints from Demonstrations for Safe Trajectory Generation

要約

デモンストレーションからの学習は、ロボットが人間の動作を模倣することを可能にする。しかし、これらの方法は、学習したスキルの安全性を確保するために重要な制約をモデル化していない。さらに、制約を明示的にモデル化する場合でも、既知のコスト関数の仮定に依存しているため、コストが未知のタスクに対する実用的な有用性に限界がある。本研究では、コスト関数の学習と未知の制約の同定を分離することで、コストと制約の推定を可能にする2段階の最適化プロセスを提案する。最初に、実演の一部に対する制約の影響を分離することにより、コスト関数を同定する。その後、未知の制約を同定するために制約リーン法を用いる。我々のアプローチは、シミュレートされた軌道と実際のロボット操作タスクの両方で検証される。我々の実験は、誤ったコスト推定が学習された制約に与える影響を示し、提案手法が、コストに関する初期知識なしに、デモンストレーションされた軌道から、障害物のような未知の制約を推論できることを説明する。

要約(オリジナル)

Learning from Demonstration allows robots to mimic human actions. However, these methods do not model constraints crucial to ensure safety of the learned skill. Moreover, even when explicitly modelling constraints, they rely on the assumption of a known cost function, which limits their practical usability for task with unknown cost. In this work we propose a two-step optimization process that allow to estimate cost and constraints by decoupling the learning of cost functions from the identification of unknown constraints within the demonstrated trajectories. Initially, we identify the cost function by isolating the effect of constraints on parts of the demonstrations. Subsequently, a constraint leaning method is used to identify the unknown constraints. Our approach is validated both on simulated trajectories and a real robotic manipulation task. Our experiments show the impact that incorrect cost estimation has on the learned constraints and illustrate how the proposed method is able to infer unknown constraints, such as obstacles, from demonstrated trajectories without any initial knowledge of the cost.

arxiv情報

著者 Shivam Chaubey,Francesco Verdoja,Ville Kyrki
発行日 2024-05-06 14:02:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク