Learning from Few Demonstrations with Frame-Weighted Motion Generation

要約

デモンストレーションから学ぶ (LfD) は、人間のデモンストレーションから多様なスキルをエンコードすることを目的としています。
この分野は、ロボット工学の専門知識を必要とせずにロボットへの知識の伝達を容易にするため、人気が高まっています。
タスクの実行中、ロボットの動きは通常、環境によって課される制約の影響を受けます。
これに照らして、タスク パラメーター化された LfD (TP-LfD) は、関連するコンテキスト情報を参照フレームにエンコードし、新しい状況に対するより優れたスキルの一般化を可能にします。
ただし、ほとんどの TP-LfD アルゴリズムでは、意味のあるモデルに十分な統計を確保するために、さまざまな環境条件で複数のデモンストレーションが必要です。
さまざまなシチュエーションを作成し、それらすべての下でデモンストレーションを実行することは、ロボット ユーザーにとって簡単な作業ではありません。
したがって、この論文では、タスク実行中にフレームの重要性/関連性をキャプチャする参照フレームの重みを見つけることにより、いくつかのデモンストレーションからモーション ポリシーを学習するための新しい概念を提示します。
シミュレーションと実際のロボット環境の両方での実験結果は、私たちのアプローチを検証します。

要約(オリジナル)

Learning from Demonstration (LfD) aims to encode versatile skills from human demonstrations. The field has been gaining popularity since it facilitates knowledge transfer to robots without requiring expert knowledge in robotics. During task executions, the robot motion is usually influenced by constraints imposed by environments. In light of this, task-parameterized LfD (TP-LfD) encodes relevant contextual information in reference frames, enabling better skill generalization to new situations. However, most TP-LfD algorithms require multiple demonstrations in various environment conditions to ensure sufficient statistics for a meaningful model. It is not a trivial task for robot users to create different situations and perform demonstrations under all of them. Therefore, this paper presents a novel concept for learning motion policies from few demonstrations by finding the reference frame weights which capture frame importance/relevance during task executions. Experimental results in both simulation and real robotic environments validate our approach.

arxiv情報

著者 Jianyong Sun,Jihong Zhu,Jens Kober,Michael Gienger
発行日 2023-03-24 17:56:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク