Safe Time-Varying Optimization based on Gaussian Processes with Spatio-Temporal Kernel

要約

安全性の確保は、ロボット工学やプロセス制御などの連続的な意思決定の問題において重要な側面です。
基盤となるシステムの複雑さにより、特に安全性が重要なシステムが時間とともに変化する場合、最適な決定を見つけることが困難になることがよくあります。
未知の時間変化する安全制約の影響を受ける未知の時間変化する報酬を最適化するという問題を克服するために、時空間カーネルを使用したベイジアン最適化に基づいて構築された新しいアルゴリズムである TVSafeOpt を提案します。
このアルゴリズムは、明示的な変更検出を必要とせずに、時間とともに変化する安全領域を安全に追跡できます。
最適化問題が定常になった場合、アルゴリズムの最適性も保証されます。
安全性と最適性の両方に関して、合成データでは TVSafeOpt が SafeOpt に比べて有利であることを示します。
ガスコンプレッサーを使用した現実的なケーススタディの評価により、TVSafeOpt が未知の報酬関数と安全関数を持つ時変最適化問題を解く際に安全性を確保することが確認されました。

要約(オリジナル)

Ensuring safety is a key aspect in sequential decision making problems, such as robotics or process control. The complexity of the underlying systems often makes finding the optimal decision challenging, especially when the safety-critical system is time-varying. Overcoming the problem of optimizing an unknown time-varying reward subject to unknown time-varying safety constraints, we propose TVSafeOpt, a new algorithm built on Bayesian optimization with a spatio-temporal kernel. The algorithm is capable of safely tracking a time-varying safe region without the need for explicit change detection. Optimality guarantees are also provided for the algorithm when the optimization problem becomes stationary. We show that TVSafeOpt compares favorably against SafeOpt on synthetic data, both regarding safety and optimality. Evaluation on a realistic case study with gas compressors confirms that TVSafeOpt ensures safety when solving time-varying optimization problems with unknown reward and safety functions.

arxiv情報

著者 Jialin Li,Marta Zagorowska,Giulia De Pasquale,Alisa Rupenyan,John Lygeros
発行日 2024-09-26 16:09:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC パーマリンク