Constrained Stein Variational Trajectory Optimization

要約

我々は、一連の軌道に制約を付けて軌道最適化を並行して実行するアルゴリズムである、制約付きスタイン変分軌道最適化 (CSVTO) を紹介します。
私たちは、制約付き軌道の最適化を、軌道分布に対する制約付き関数最小化の新しい形式として構成します。これにより、目的における制約をペナルティとして扱うことが回避され、制約を満たす軌道の多様なセットを生成できるようになります。
私たちの方法では、スタイン変分勾配降下法 (SVGD) を使用して、制約に従いながら低コストの軌道にわたる分布を近似する粒子のセットを見つけます。
CSVTO は、微分可能な等式および不等式制約を伴う問題に適用でき、極小値を回避するための新しい粒子の再サンプリング ステップが含まれています。
多様な軌跡のセットを明示的に生成することにより、CSVTO は不適切な極小値をより適切に回避でき、初期化に対してより堅牢になります。
7DoF レンチ操作タスクなど、高度に制約された困難なタスクにおいて CSVTO がベースラインを上回るパフォーマンスを示し、CSVTO は成功と制約満足度の両方ですべてのベースラインを上回ります。

要約(オリジナル)

We present Constrained Stein Variational Trajectory Optimization (CSVTO), an algorithm for performing trajectory optimization with constraints on a set of trajectories in parallel. We frame constrained trajectory optimization as a novel form of constrained functional minimization over trajectory distributions, which avoids treating the constraints as a penalty in the objective and allows us to generate diverse sets of constraint-satisfying trajectories. Our method uses Stein Variational Gradient Descent (SVGD) to find a set of particles that approximates a distribution over low-cost trajectories while obeying constraints. CSVTO is applicable to problems with differentiable equality and inequality constraints and includes a novel particle re-sampling step to escape local minima. By explicitly generating diverse sets of trajectories, CSVTO is better able to avoid poor local minima and is more robust to initialization. We demonstrate that CSVTO outperforms baselines in challenging highly-constrained tasks, such as a 7DoF wrench manipulation task, where CSVTO outperforms all baselines both in success and constraint satisfaction.

arxiv情報

著者 Thomas Power,Dmitry Berenson
発行日 2024-07-23 08:52:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク