要約
この作業では、モーション表現に B スプラインを活用する新しい移動プリミティブ (MP) バリアントである B スプライン移動プリミティブ (BMP) が導入されています。
B スプラインは、境界条件を満たしながら、つまり、指定された所望の位置を所望の速度で通過するという条件を満たしながら、わずか数個の制御点で複雑で滑らかな軌道を生成できるため、動作計画においてよく知られた概念です。
ただし、B スプラインの現在の使用法は、軌道分布の高次統計を無視する傾向があるため、軌道分布のモデリングが不可欠な模倣学習 (IL) や強化学習 (RL) での使用が制限されています。
対照的に、MP は軌道の尤度や相関関係を捕捉する能力があるため、IL および RL で一般的に使用されます。
ただし、MP は境界条件を満たす能力に制約を受けており、通常、速度制約を満たすために学習目標に追加の項が必要です。
B スプラインを基底関数と重みパラメーターによって表される MP として再定式化することにより、BMP は両方のアプローチの長所を組み合わせ、B スプラインが境界条件を満たす能力を維持しながら高次の統計を取得できるようにします。
IL と RL の実験結果は、BMP がロボット学習における B スプラインの適用範囲を広げ、既存の MP バリアントと比較してより優れた表現力を提供することを示しています。
要約(オリジナル)
This work introduces B-spline Movement Primitives (BMPs), a new Movement Primitive (MP) variant that leverages B-splines for motion representation. B-splines are a well-known concept in motion planning due to their ability to generate complex, smooth trajectories with only a few control points while satisfying boundary conditions, i.e., passing through a specified desired position with desired velocity. However, current usages of B-splines tend to ignore the higher-order statistics in trajectory distributions, which limits their usage in imitation learning (IL) and reinforcement learning (RL), where modeling trajectory distribution is essential. In contrast, MPs are commonly used in IL and RL for their capacity to capture trajectory likelihoods and correlations. However, MPs are constrained by their abilities to satisfy boundary conditions and usually need extra terms in learning objectives to satisfy velocity constraints. By reformulating B-splines as MPs, represented through basis functions and weight parameters, BMPs combine the strengths of both approaches, allowing B-splines to capture higher-order statistics while retaining their ability to satisfy boundary conditions. Empirical results in IL and RL demonstrate that BMPs broaden the applicability of B-splines in robot learning and offer greater expressiveness compared to existing MP variants.
arxiv情報
著者 | Weiran Liao,Ge Li,Hongyi Zhou,Rudolf Lioutikov,Gerhard Neumann |
発行日 | 2024-11-15 16:35:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google