要約
計算効率と信頼性の高い制約満足を備えた開ループ最適制御問題を解決する必要性を動機として、拡散モデルと数値最適化ソルバーを組み合わせた一般的なフレームワークを導入します。
最適制御問題は、閉じた形式で解決できることはほとんどないため、多くの場合、初期推定が必要となる数値軌道最適化問題に変換されます。
これらの初期推定は、拡散モデルによってフレームワークに提供されます。
問題の制約に違反するサンプルの影響を軽減するために、トレーニングで制約違反の損失を追加して局所最適解の真の分布を近似する新しい制約付き拡散モデルを開発します。
ロバスト性をさらに強化するために、初期推定として拡散サンプルが数値ソルバーに供給され、最終的な最適な (したがって実行可能な) ソリューションが洗練され導出されます。
3 つのタスクの実験評価により、提案されたフレームワークを使用した 4$\times$ から 30$\times$ の加速による制約満足度の向上と計算効率が検証されます。このフレームワークは、軌道最適化問題全体を一般化し、問題の複雑さに合わせて適切に拡張します。
要約(オリジナル)
Motivated by the need to solve open-loop optimal control problems with computational efficiency and reliable constraint satisfaction, we introduce a general framework that combines diffusion models and numerical optimization solvers. Optimal control problems are rarely solvable in closed form, hence they are often transcribed into numerical trajectory optimization problems, which then require initial guesses. These initial guesses are supplied in our framework by diffusion models. To mitigate the effect of samples that violate the problem constraints, we develop a novel constrained diffusion model to approximate the true distribution of locally optimal solutions with an additional constraint violation loss in training. To further enhance the robustness, the diffusion samples as initial guesses are fed to the numerical solver to refine and derive final optimal (and hence feasible) solutions. Experimental evaluations on three tasks verify the improved constraint satisfaction and computational efficiency with 4$\times$ to 30$\times$ acceleration using our proposed framework, which generalizes across trajectory optimization problems and scales well with problem complexity.
arxiv情報
著者 | Anjian Li,Zihan Ding,Adji Bousso Dieng,Ryne Beeson |
発行日 | 2024-05-26 16:52:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google