Similarity-Aware Skill Reproduction based on Multi-Representational Learning from Demonstration

要約

Learning from Demonstration (LfD) アルゴリズムにより、人間はデモンストレーションを通じてロボットに新しいスキルを教えることができます。
学習したスキルは、同一または境界条件に近い状態 (初期点など) から確実に再現できます。
ただし、分散がより大きい境界条件にわたって学習したスキルを一般化する場合、再現の類似性は境界条件ごとに変化し、単一の LfD 表現では汎化領域全体で一貫した類似性を維持できません。
我々は、複数の LfD 表現と、特定の境界条件に対して最も高い類似値を持つ再現を見つけることでスキルの汎化を向上できる類似性メトリクスを含む、新しい類似性認識フレームワークを提案します。
スキルのデモンストレーションを考慮すると、私たちのフレームワークは、類似性メトリックを使用して個々の LfD 表現を評価することによって、関心のある点 (たとえば、初期点) の周囲に類似性領域を構築します。
このボリューム内の任意の点は、最も類似性の高いスキルを再現する表現に対応します。
物理的な 6-DOF ロボットを使用した 3 セットのシミュレーション実験と 4 セットの実世界実験で、多表現フレームワークを検証します。
また、286 回の模擬実験で 11 の異なる類似性メトリクスを評価し、それらのバイアスに従って分類しました。

要約(オリジナル)

Learning from Demonstration (LfD) algorithms enable humans to teach new skills to robots through demonstrations. The learned skills can be robustly reproduced from the identical or near boundary conditions (e.g., initial point). However, when generalizing a learned skill over boundary conditions with higher variance, the similarity of the reproductions changes from one boundary condition to another, and a single LfD representation cannot preserve a consistent similarity across a generalization region. We propose a novel similarity-aware framework including multiple LfD representations and a similarity metric that can improve skill generalization by finding reproductions with the highest similarity values for a given boundary condition. Given a demonstration of the skill, our framework constructs a similarity region around a point of interest (e.g., initial point) by evaluating individual LfD representations using the similarity metric. Any point within this volume corresponds to a representation that reproduces the skill with the greatest similarity. We validate our multi-representational framework in three simulated and four sets of real-world experiments using a physical 6-DOF robot. We also evaluate 11 different similarity metrics and categorize them according to their biases in 286 simulated experiments.

arxiv情報

著者 Brendan Hertel,S. Reza Ahmadzadeh
発行日 2024-06-28 12:47:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク