要約
偶然に制約された確率的最適制御問題を解決することは、制御における重要な課題です。
これは、少数の特殊なケースまでは分析ソリューションが存在しないためです。
チャンス制約のある確率的最適制御問題に取り組むための一般的で計算効率の高いアプローチは、チャンス制約を制約を厳しくするパラメーターを備えたハード制約として再定式化することで構成されます。
ただし、このようなアプローチでは、制約を厳しくするパラメータの選択は依然として困難であり、プロセス ノイズの分布が事前にわかっていると仮定すると、ほとんどの保証が得られます。
さらに、確率の制約が厳密に満たされないことが多く、不必要に高いコストが発生します。
この研究では、制御中にオンラインで制約を強化するパラメータを学習するためのデータ駆動型のアプローチを提案します。
この目的を達成するために、閉ループの制約を厳しくするパラメータの選択を二項回帰問題として再定式化します。
次に、表現力の高い \gls{gp} モデルを二値回帰に利用して、確率制約を満たす最小の制約強化パラメーターを近似します。
アルゴリズム パラメーターを適切に調整することにより、結果として得られる制約を強化するパラメーターが、任意の小さなマージンまで確率制約を高確率で満たすことを示します。
私たちのアプローチは、数値実験における確率制約を厳密に満たす制約を厳しくしたパラメーターを生成し、他の 3 つの最先端のアプローチよりも平均コストが低くなります。
要約(オリジナル)
Solving chance-constrained stochastic optimal control problems is a significant challenge in control. This is because no analytical solutions exist for up to a handful of special cases. A common and computationally efficient approach for tackling chance-constrained stochastic optimal control problems consists of reformulating the chance constraints as hard constraints with a constraint-tightening parameter. However, in such approaches, the choice of constraint-tightening parameter remains challenging, and guarantees can mostly be obtained assuming that the process noise distribution is known a priori. Moreover, the chance constraints are often not tightly satisfied, leading to unnecessarily high costs. This work proposes a data-driven approach for learning the constraint-tightening parameters online during control. To this end, we reformulate the choice of constraint-tightening parameter for the closed-loop as a binary regression problem. We then leverage a highly expressive \gls{gp} model for binary regression to approximate the smallest constraint-tightening parameters that satisfy the chance constraints. By tuning the algorithm parameters appropriately, we show that the resulting constraint-tightening parameters satisfy the chance constraints up to an arbitrarily small margin with high probability. Our approach yields constraint-tightening parameters that tightly satisfy the chance constraints in numerical experiments, resulting in a lower average cost than three other state-of-the-art approaches.
arxiv情報
著者 | Alexandre Capone,Tim Brüdigam,Sandra Hirche |
発行日 | 2023-10-04 16:22:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google