A Structured Prediction Approach for Robot Imitation Learning

要約

ロボットの模倣学習をデモンストレーションから行うための構造化予測アプローチを提案します。
ロボット模倣学習のためのさまざまなツールの中で、教師あり学習が重要な役割を果たしていることが観察されています。
構造化予測は教師あり学習の一種で、複雑な構造を持つ出力空間で学習モデルを動作させることができます。
構造化予測のレンズを通して、ロボットがユークリッド空間だけでなくリーマン多様体にも属する軌道を模倣する方法を学習する方法を示します。
情報理論からのアイデアを活用して、実証された確率的軌道と再現された確率的軌道の間の情報損失を測定するために、f ダイバージェンスに基づく損失関数のクラスを提案します。
異なるタイプの f ダイバージェンスは、異なるポリシーをもたらします。これを模倣モードと呼びます。
さらに、私たちのアプローチは、ロボットが作業条件の変化に適応するために必要な、空間的および時間的な軌道変調を組み込むことを可能にします。
私たちは、軌道の再現と適応の観点から、最先端の手法に対してアルゴリズムをベンチマークします。
定量的評価は、私たちのアプローチが精度と効率の両方において他のアルゴリズムよりも優れていることを示しています。
また、KUKA LWR ロボットアームを使用した研磨タスクにおける多様体の軌道の学習に関する実際の実験結果も報告し、アルゴリズム フレームワークの有効性を示しています。

要約(オリジナル)

We propose a structured prediction approach for robot imitation learning from demonstrations. Among various tools for robot imitation learning, supervised learning has been observed to have a prominent role. Structured prediction is a form of supervised learning that enables learning models to operate on output spaces with complex structures. Through the lens of structured prediction, we show how robots can learn to imitate trajectories belonging to not only Euclidean spaces but also Riemannian manifolds. Exploiting ideas from information theory, we propose a class of loss functions based on the f-divergence to measure the information loss between the demonstrated and reproduced probabilistic trajectories. Different types of f-divergence will result in different policies, which we call imitation modes. Furthermore, our approach enables the incorporation of spatial and temporal trajectory modulation, which is necessary for robots to be adaptive to the change in working conditions. We benchmark our algorithm against state-of-the-art methods in terms of trajectory reproduction and adaptation. The quantitative evaluation shows that our approach outperforms other algorithms regarding both accuracy and efficiency. We also report real-world experimental results on learning manifold trajectories in a polishing task with a KUKA LWR robot arm, illustrating the effectiveness of our algorithmic framework.

arxiv情報

著者 Anqing Duan,Iason Batzianoulis,Raffaello Camoriano,Lorenzo Rosasco,Daniele Pucci,Aude Billard
発行日 2023-09-26 10:52:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク