Learning a Reward Function for User-Preferred Appliance Scheduling

要約

電力部門の炭素排出量削減には、家庭部門によるデマンドレスポンスサービス提供の開発を加速することが不可欠です。
インフラストラクチャの進歩とともに、エンドユーザーの参加を促すことが重要です。
エンド ユーザーはプライバシーとコントロールを非常に重視しており、毎日のアプライアンスの操作スケジュールを作成する際に、サービスの設計と意思決定のプロセスに参加してもらいたいと考えています。
さらに、経済的または環境的動機がない限り、電力システムのバランスをとるために快適さを犠牲にする用意は一般的にありません。
この論文では、エンド ユーザーにニーズや希望を明示的に要求することなく、エンド ユーザーの毎日のアプライアンス スケジュールを作成するのに役立つ逆強化学習ベースのモデルを紹介します。
過去の消費データを使用することで、最終消費者はそれらの決定の作成に暗黙的に参加することになり、デマンド レスポンス サービスの提供に継続的に参加する意欲が高まります。

要約(オリジナル)

Accelerated development of demand response service provision by the residential sector is crucial for reducing carbon-emissions in the power sector. Along with the infrastructure advancement, encouraging the end users to participate is crucial. End users highly value their privacy and control, and want to be included in the service design and decision-making process when creating the daily appliance operation schedules. Furthermore, unless they are financially or environmentally motivated, they are generally not prepared to sacrifice their comfort to help balance the power system. In this paper, we present an inverse-reinforcement-learning-based model that helps create the end users’ daily appliance schedules without asking them to explicitly state their needs and wishes. By using their past consumption data, the end consumers will implicitly participate in the creation of those decisions and will thus be motivated to continue participating in the provision of demand response services.

arxiv情報

著者 Nikolina Čović,Jochen L. Cremer,Hrvoje Pandžić
発行日 2024-06-10 15:43:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク