要約
厳しい実行時間制約の下で同様の最適化問題を順次解決することは、ロボット制御、自動運転、ポートフォリオ管理などの多くのアプリケーションにとって不可欠です。
これらの設定における局所最適化手法のパフォーマンスは、初期解の影響を受けやすくなります。初期化が不十分だと、収束が遅くなったり、最適解が次善されたりする可能性があります。
この課題に対処するために、問題のインスタンスを定義するパラメーターが与えられたとき、 \emph{multiple} の多様な初期解を予測する方法を学習することを提案します。
複数の初期ソリューションを利用するための 2 つの戦略を紹介します。(i) 選択関数を使用して最も有望な初期ソリューションが選択される単一オプティマイザー アプローチ、および (ii) 複数のオプティマイザーが潜在的に並行して実行されるマルチ オプティマイザー アプローチ
、それぞれが異なるソリューションで初期化され、後で最適なソリューションが選択されます。
さまざまなオプティマイザ (DDP、MPPI、iLQR) を使用して、カートポール、リーチャー、自動運転という 3 つの最適な制御ベンチマーク タスクでメソッドを検証します。
すべての評価設定において、この方法により大幅かつ一貫した改善が見られ、必要な初期ソリューションの数に応じて効率的に拡張できることが実証されました。
コードは $\href{https://github.com/EladSharony/miso}{\tt{https://github.com/EladSharony/miso}}$ で入手できます。
要約(オリジナル)
Sequentially solving similar optimization problems under strict runtime constraints is essential for many applications, such as robot control, autonomous driving, and portfolio management. The performance of local optimization methods in these settings is sensitive to the initial solution: poor initialization can lead to slow convergence or suboptimal solutions. To address this challenge, we propose learning to predict \emph{multiple} diverse initial solutions given parameters that define the problem instance. We introduce two strategies for utilizing multiple initial solutions: (i) a single-optimizer approach, where the most promising initial solution is chosen using a selection function, and (ii) a multiple-optimizers approach, where several optimizers, potentially run in parallel, are each initialized with a different solution, with the best solution chosen afterward. We validate our method on three optimal control benchmark tasks: cart-pole, reacher, and autonomous driving, using different optimizers: DDP, MPPI, and iLQR. We find significant and consistent improvement with our method across all evaluation settings and demonstrate that it efficiently scales with the number of initial solutions required. The code is available at $\href{https://github.com/EladSharony/miso}{\tt{https://github.com/EladSharony/miso}}$.
arxiv情報
著者 | Elad Sharony,Heng Yang,Tong Che,Marco Pavone,Shie Mannor,Peter Karkus |
発行日 | 2024-11-04 15:17:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google