Jointly Learning Cost and Constraints from Demonstrations for Safe Trajectory Generation

要約

デモンストレーションから学習することで、ロボットは人間の動作を模倣できるようになります。
ただし、これらの方法は、学習したスキルの安全性を確保するために重要な制約をモデル化していません。
さらに、制約を明示的にモデル化する場合でも、既知のコスト関数の仮定に依存するため、コストが未知のタスクに対する実際の使用可能性が制限されます。
この研究では、実証された軌道内の未知の制約の特定からコスト関数の学習を切り離すことにより、コストと制約の推定を可能にする 2 段階の最適化プロセスを提案します。
最初に、デモンストレーションの一部に対する制約の影響を分離することでコスト関数を特定します。
その後、制約学習法を使用して未知の制約を特定します。
私たちのアプローチは、シミュレートされた軌道と実際のロボット操作タスクの両方で検証されています。
私たちの実験は、不正確なコスト推定が学習された制約に与える影響を示し、提案された方法がコストに関する初期知識なしに実証された軌道から障害物などの未知の制約をどのように推測できるかを示しています。

要約(オリジナル)

Learning from Demonstration allows robots to mimic human actions. However, these methods do not model constraints crucial to ensure safety of the learned skill. Moreover, even when explicitly modelling constraints, they rely on the assumption of a known cost function, which limits their practical usability for task with unknown cost. In this work we propose a two-step optimization process that allow to estimate cost and constraints by decoupling the learning of cost functions from the identification of unknown constraints within the demonstrated trajectories. Initially, we identify the cost function by isolating the effect of constraints on parts of the demonstrations. Subsequently, a constraint leaning method is used to identify the unknown constraints. Our approach is validated both on simulated trajectories and a real robotic manipulation task. Our experiments show the impact that incorrect cost estimation has on the learned constraints and illustrate how the proposed method is able to infer unknown constraints, such as obstacles, from demonstrated trajectories without any initial knowledge of the cost.

arxiv情報

著者 Shivam Chaubey,Francesco Verdoja,Ville Kyrki
発行日 2024-09-09 15:24:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク