Online state vector reduction during model predictive control with gradient-based trajectory optimisation

要約

高次元システムにおける把握不可能な操作は、さまざまな理由から困難です。
主な理由の 1 つは、大規模な状態空間に伴う計算時間が長くなるということです。
軌道最適化アルゴリズムは、さまざまなタスクでその有用性が証明されていますが、ほとんどの方法と同様に、乱雑な中での把握しにくい操作や変形可能なオブジェクトの操作まで、遍在する高次元システムに拡張するのに苦労しています。
私たちは、システムが進化するにつれて、操作中にさまざまな自由度が時間の経過とともにタスクにとって多かれ少なかれ重要になるだろうと推論します。
このアイデアを活用して、軌道最適化問題で考慮される自由度の数を減らし、計画時間を短縮します。
この考え方は、最適化問題のコスト状況が絶えず進化するモデル予測制御 (MPC) のコンテキストに特に関連します。
非同期 MPC でのシミュレーション結果を提供し、私たちの方法が軌道を効果的に最適化しながら、ポリシーラグの減少により全体的なパフォーマンスの向上を達成できることを示します。

要約(オリジナル)

Non-prehensile manipulation in high-dimensional systems is challenging for a variety of reasons. One of the main reasons is the computationally long planning times that come with a large state space. Trajectory optimisation algorithms have proved their utility in a wide variety of tasks, but, like most methods struggle scaling to the high dimensional systems ubiquitous to non-prehensile manipulation in clutter as well as deformable object manipulation. We reason that, during manipulation, different degrees of freedom will become more or less important to the task over time as the system evolves. We leverage this idea to reduce the number of degrees of freedom considered in a trajectory optimisation problem, to reduce planning times. This idea is particularly relevant in the context of model predictive control (MPC) where the cost landscape of the optimisation problem is constantly evolving. We provide simulation results under asynchronous MPC and show our methods are capable of achieving better overall performance due to the decreased policy lag whilst still being able to optimise trajectories effectively.

arxiv情報

著者 David Russell,Rafael Papallas,Mehmet Dogar
発行日 2024-09-12 14:23:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク