Water and Electricity Consumption Forecasting at an Educational Institution using Machine Learning models with Metaheuristic Optimization

要約

教育機関は経済的および社会的発展に不可欠です。
近年のブラジルの予算削減により、その活動やプロジェクトの実施が困難になっています。
水道や電気などの経費の場合、漏水や設備の故障など予期せぬ事態が起こり、管理が難しくなります。
この研究では、パラン・ア・キャンパス・パルマス連邦研究所における水と電気の消費量の予測について、12 か月の予測期間を持つ 2 つの機械学習モデル、ランダム フォレスト (RF) とサポート ベクトル回帰 (SVR) の比較を提案しています。
だけでなく、外生的特徴としての気候変数の適用の影響も評価します。
データは過去 5 年間にわたって収集され、請求書に関する詳細と外生および内生変数を組み合わせたものです。
2 つのモデルは、遺伝的アルゴリズム (GA) を使用してハイパーパラメーターを最適化し、気候変数の有無にかかわらず予測を実行するのに最適な適応度を持つ個人を選択しました。
絶対パーセント誤差と二乗平均平方根誤差が、予測精度を評価するためのパフォーマンスの尺度として使用されました。
この結果は、12 段階の期間にわたる水と電気の消費量を予測する際に、ランダム フォレスト モデルが最も優れたパフォーマンスを示したことを示唆しています。
気候変数を統合すると、多くの場合、予測精度が低下し、誤差が増加します。
どちらのモデルも水の消費量を予測するのに依然として一定の困難があり、異なるモデルまたは変数を使用した新しい研究が歓迎されることを示しています。

要約(オリジナル)

Educational institutions are essential for economic and social development. Budget cuts in Brazil in recent years have made it difficult to carry out their activities and projects. In the case of expenses with water and electricity, unexpected situations can occur, such as leaks and equipment failures, which make their management challenging. This study proposes a comparison between two machine learning models, Random Forest (RF) and Support Vector Regression (SVR), for water and electricity consumption forecasting at the Federal Institute of Paran\’a-Campus Palmas, with a 12-month forecasting horizon, as well as evaluating the influence of the application of climatic variables as exogenous features. The data were collected over the past five years, combining details pertaining to invoices with exogenous and endogenous variables. The two models had their hyperpa-rameters optimized using the Genetic Algorithm (GA) to select the individuals with the best fitness to perform the forecasting with and without climatic variables. The absolute percentage errors and root mean squared error were used as performance measures to evaluate the forecasting accuracy. The results suggest that in forecasting water and electricity consumption over a 12-step horizon, the Random Forest model exhibited the most superior performance. The integration of climatic variables often led to diminished forecasting accuracy, resulting in higher errors. Both models still had certain difficulties in predicting water consumption, indicating that new studies with different models or variables are welcome.

arxiv情報

著者 Eduardo Luiz Alba,Matheus Henrique Dal Molin Ribeiro,Gilson Adamczuk,Flavio Trojan,Erick Oliveira Rodrigues
発行日 2024-10-25 17:30:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク