DiTEC-WDN: A Large-Scale Dataset of Hydraulic Scenarios across Multiple Water Distribution Networks

要約

プライバシーの制限は、実際の配電式(WDN)モデルの共有を妨げ、一般的に広範な観測が必要な、新しいデータ駆動型の機械学習の適用を制限します。
この課題に対処するために、短期(24時間)または長期(1年)のいずれかでシミュレートされた36,000の一意のシナリオで構成されるデータセットDITEC-WDNを提案します。
重要なパラメーター(圧力、流量、需要パターンなど)を最適化する自動パイプラインを使用してこのデータセットを構築し、大規模なシミュレーションを容易にし、ルール検証と事後分析を介して標準条件下で個別の合成で合成が油圧的に現実的な状態を記録します。
合計2億2,800万人の生成されたグラフベースの状態により、DITEC-WDNは、グラフレベル、ノードレベル、リンクレベルの回帰、および時系列予測など、さまざまな機械学習タスクをサポートできます。
公開免許の下でリリースされたこの貢献は、重要な水セクターでのオープンな科学研究を促進し、機密データを公開するリスクを排除し、研究比較とシナリオ分析のために大規模な配水販売ネットワークベンチマークの必要性を満たします。

要約(オリジナル)

Privacy restrictions hinder the sharing of real-world Water Distribution Network (WDN) models, limiting the application of emerging data-driven machine learning, which typically requires extensive observations. To address this challenge, we propose the dataset DiTEC-WDN that comprises 36,000 unique scenarios simulated over either short-term (24 hours) or long-term (1 year) periods. We constructed this dataset using an automated pipeline that optimizes crucial parameters (e.g., pressure, flow rate, and demand patterns), facilitates large-scale simulations, and records discrete, synthetic but hydraulically realistic states under standard conditions via rule validation and post-hoc analysis. With a total of 228 million generated graph-based states, DiTEC-WDN can support a variety of machine-learning tasks, including graph-level, node-level, and link-level regression, as well as time-series forecasting. This contribution, released under a public license, encourages open scientific research in the critical water sector, eliminates the risk of exposing sensitive data, and fulfills the need for a large-scale water distribution network benchmark for study comparisons and scenario analysis.

arxiv情報

著者 Huy Truong,Andrés Tello,Alexander Lazovik,Victoria Degeler
発行日 2025-03-24 14:40:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク