ReLBOT: A Transfer Learning Approach to Minimize Reinforcement Learning Risks in Smart Buildings

要約

タイトル: スマートビルディングでのリスク最小化のための転移学習アプローチであるReLBOT

– スマートビルディングは人工知能アルゴリズムを適用することでエネルギー消費を最適化しようとしている
– スマートビルディングを委託するときはアルゴリズムをトレーニングするために使用できる履歴データがない
– オンライン強化学習(RL)アルゴリズムは有望だが、RLエージェントが最初に行動空間を探索すると、ビルの住民に大きな不快感をもたらすリスクが大きい
– この論文では、既存の最適化されたスマートビルディングから知識を転移することで、新しく委託された建物でRLエージェントのウォームアップ期間の負の影響を軽減する新しい技術であるReLBOTを紹介する
– 強化学習エージェントのウォームアップ期間の長さについて最大6.2倍、予測分散について最大132倍の改善を実証する

要約(オリジナル)

Smart buildings aim to optimize energy consumption by applying artificial intelligent algorithms. When a smart building is commissioned there is no historical data that could be used to train these algorithms. On-line Reinforcement Learning (RL) algorithms have shown significant promise, but their deployment carries a significant risk, because as the RL agent initially explores its action space it could cause significant discomfort to the building residents. In this paper we present ReLBOT, a new technique that uses transfer learning in conjunction with deep RL to transfer knowledge from an existing, optimized smart building, to the newly commissioning building, to reduce the adverse impact of the reinforcement learning agent’s warm-up period. We demonstrate improvements of up to 6.2 times in the duration, and up to 132 times in prediction variance for the reinforcement learning agent’s warm-up period.

arxiv情報

著者 Mikhail Genkin,J. J. McArthru
発行日 2023-04-30 01:52:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY パーマリンク