Learning from Successful and Failed Demonstrations via Optimization

要約

Learning from Demonstration (LfD) は、望ましいスキルを実行する正しい方法を示すことによって、人間がロボットに新しいスキルを教えることを可能にする一般的なアプローチです。
ただし、人間が提供するデモンストレーションが常に最適であるとは限らず、教師は通常、最適ではない (ノイズが多い、または欠陥のある) デモンストレーションを破棄または置き換えることでこの問題に対処します。
私たちは、スキルのデモンストレーションの成功と失敗の両方から学ぶ、新しい LfD 表現を提案します。
私たちのアプローチは、キャ​​プチャされたデモンストレーション(教師によってラベル付けされた)の 2 つのサブセットを統計スキル モデルにエンコードし、二次コストのセットを構築し、新しい問題条件(つまり制約)の下でスキルの最適な再現を見つけます。
最適な再現では、成功例への収束と失敗例からの発散のバランスがとれます。
私たちは、UR5e マニピュレーター アームを使用した実世界でのいくつかの 2D および 3D 実験を通じてアプローチを評価し、失敗したデモンストレーションのみからスキルを再現できることも示します。
失敗したデモンストレーションと成功したデモンストレーションの両方を活用する利点は、2 つの既存の LfD アプローチとの比較を通じて示されます。
また、私たちのアプローチを既存のスキル向上方法と比較し、複数の座標設定でのその機能を示します。

要約(オリジナル)

Learning from Demonstration (LfD) is a popular approach that allows humans to teach robots new skills by showing the correct way(s) of performing the desired skill. Human-provided demonstrations, however, are not always optimal and the teacher usually addresses this issue by discarding or replacing sub-optimal (noisy or faulty) demonstrations. We propose a novel LfD representation that learns from both successful and failed demonstrations of a skill. Our approach encodes the two subsets of captured demonstrations (labeled by the teacher) into a statistical skill model, constructs a set of quadratic costs, and finds an optimal reproduction of the skill under novel problem conditions (i.e. constraints). The optimal reproduction balances convergence towards successful examples and divergence from failed examples. We evaluate our approach through several 2D and 3D experiments in real-world using a UR5e manipulator arm and also show that it can reproduce a skill from only failed demonstrations. The benefits of exploiting both failed and successful demonstrations are shown through comparison with two existing LfD approaches. We also compare our approach against an existing skill refinement method and show its capabilities in a multi-coordinate setting.

arxiv情報

著者 Brendan Hertel,S. Reza Ahmadzadeh
発行日 2024-06-28 12:38:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク