Conditional Neural Expert Processes for Learning from Demonstration

要約

Learning from Demonstration (LfD) は、ロボット工学のスキル習得に広く使用されている手法です。
ただし、同じスキルのデモンストレーションに大きな差異が見られる場合や、学習システムが同じスキルの異なる手段を同時に習得しようとする場合があり、これらの動きを動作プリミティブにエンコードすることが困難になります。
これらの課題に対処するために、我々は LfD フレームワーク、すなわち条件付きニューラル エキスパート プロセス (CNEP) を提案します。このフレームワークは、潜在空間内の固有の情報を利用して、エキスパートとエンコードされた表現を照合するために、さまざまなモードからのデモンストレーションを個別のエキスパート ネットワークに割り当てることを学習します。
CNEP では、軌道がどのモードに属するかを監視する必要はありません。
人工的に生成されたデータセットで提供された実験は、CNEP の有効性を示しています。
さらに、実際のロボットでの実験を含むさまざまなタスクで、CNEP のパフォーマンスを別の LfD フレームワークである条件付き神経運動プリミティブ (CNMP) と比較します。
その結果、動きプリミティブのモデリング パフォーマンスが向上していることが明らかになり、特にモデル入力にさまざまな軌道からの交点が含まれる場合に、専門家によって実証されたものをより正確に反映する軌道の合成が可能になります。
さらに、CNEP は専門家の専門化を促進することにより、解釈可能性の向上とより迅速な収束を実現します。
さらに、障害物との衝突を引き起こすCNMPモデルとは対照的に、CNEPモデルは新しい開始点と目的地が提供された場合に実際のマニピュレータで障害物回避タスクを達成することを示します。

要約(オリジナル)

Learning from Demonstration (LfD) is a widely used technique for skill acquisition in robotics. However, demonstrations of the same skill may exhibit significant variances, or learning systems may attempt to acquire different means of the same skill simultaneously, making it challenging to encode these motions into movement primitives. To address these challenges, we propose an LfD framework, namely the Conditional Neural Expert Processes (CNEP), that learns to assign demonstrations from different modes to distinct expert networks utilizing the inherent information within the latent space to match experts with the encoded representations. CNEP does not require supervision on which mode the trajectories belong to. Provided experiments on artificially generated datasets demonstrate the efficacy of CNEP. Furthermore, we compare the performance of CNEP with another LfD framework, namely Conditional Neural Movement Primitives (CNMP), on a range of tasks, including experiments on a real robot. The results reveal enhanced modeling performance for movement primitives, leading to the synthesis of trajectories that more accurately reflect those demonstrated by experts, particularly when the model inputs include intersection points from various trajectories. Additionally, CNEP offers improved interpretability and faster convergence by promoting expert specialization. Furthermore, we show that the CNEP model accomplishes obstacle avoidance tasks with a real manipulator when provided with novel start and destination points, in contrast to the CNMP model, which leads to collisions with the obstacle.

arxiv情報

著者 Yigit Yildirim,Emre Ugur
発行日 2024-02-13 12:52:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク