要約
建物の運営は世界のエネルギーの約 40% を消費し、暖房、換気、空調 (HVAC) システムはこの消費量の最大 50% を占めます。
HVAC のエネルギー需要が増加すると予想されるため、将来のエネルギー使用量を削減し、気候変動を緩和するには、システム効率を最適化することが重要です。
既存の制御戦略には一般化が欠けており、広範なトレーニングとデータが必要なため、さまざまな建物への迅速な導入が制限されています。
このペーパーでは、マルチゾーン HVAC 制御にインコンテキスト強化学習 (RL) を使用する意思決定事前トレーニング済みトランスフォーマーである HVAC-DPT を紹介します。
HVAC-DPT は、HVAC 制御を逐次予測タスクとしてフレーム化し、さまざまな RL エージェントによって生成された相互作用履歴に基づいて因果変換器をトレーニングします。
このアプローチにより、HVAC-DPT はネットワーク パラメーターを変更することなく、状況に応じてポリシーを調整できるため、追加のトレーニングやデータ収集を必要とせずに、さまざまな建物に導入できるようになります。
HVAC-DPT は、ベースライン コントローラーと比較して、目に見えない建物でのエネルギー消費を 45% 削減し、HVAC システムによる増大する環境への影響を軽減するためのスケーラブルで効果的なアプローチを提供します。
要約(オリジナル)
Building operations consume approximately 40% of global energy, with Heating, Ventilation, and Air Conditioning (HVAC) systems responsible for up to 50% of this consumption. As HVAC energy demands are expected to rise, optimising system efficiency is crucial for reducing future energy use and mitigating climate change. Existing control strategies lack generalisation and require extensive training and data, limiting their rapid deployment across diverse buildings. This paper introduces HVAC-DPT, a Decision-Pretrained Transformer using in-context Reinforcement Learning (RL) for multi-zone HVAC control. HVAC-DPT frames HVAC control as a sequential prediction task, training a causal transformer on interaction histories generated by diverse RL agents. This approach enables HVAC-DPT to refine its policy in-context, without modifying network parameters, allowing for deployment across different buildings without the need for additional training or data collection. HVAC-DPT reduces energy consumption in unseen buildings by 45% compared to the baseline controller, offering a scalable and effective approach to mitigating the increasing environmental impact of HVAC systems.
arxiv情報
著者 | Anaïs Berkes |
発行日 | 2024-11-29 14:46:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google