要約
強化学習を状況に応じた 2 段階の確率的最適化に適用するためのフレームワークを提案し、このフレームワークを洋上風力発電所のエネルギー市場入札の問題に適用します。
強化学習は、さまざまなコンテキストの下で 2 段階の確率的プログラムの最初の段階の変数に対する最適解に近い解を学習するために使用できる可能性があります。
提案されたフレームワークの下では、これらの解決策は、完全な 2 段階の確率的プログラムを解く必要なく学習されます。
DDPG アルゴリズムを使用したトレーニングの初期結果を示し、パフォーマンスを向上させるための将来のステップを示します。
要約(オリジナル)
We propose a framework for applying reinforcement learning to contextual two-stage stochastic optimization and apply this framework to the problem of energy market bidding of an off-shore wind farm. Reinforcement learning could potentially be used to learn close to optimal solutions for first stage variables of a two-stage stochastic program under different contexts. Under the proposed framework, these solutions would be learned without having to solve the full two-stage stochastic program. We present initial results of training using the DDPG algorithm and present intended future steps to improve performance.
arxiv情報
著者 | David Cole,Himanshu Sharma,Wei Wang |
発行日 | 2023-12-18 02:15:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google