要約
現実的な時系列サンプルを生成することは、合成データを使用してモデルのストレス テストを行い、ユーザーのプライバシーを保護するために重要です。
エンジニアリングおよび安全性が重要なアプリケーションでは、これらのサンプルは、ドメイン固有の、または物理学や自然によって自然に課せられる特定の厳しい制約を満たす必要があります。
たとえば、ピーク需要時間に制約を設けて電力需要パターンを生成することを考えてみましょう。
これは、悪天候時の電力網の機能のストレス テストに使用できます。
制約された時系列を生成するための既存のアプローチは、スケーラブルではないか、サンプルの品質が低下します。
これらの課題に対処するために、各ノイズ除去更新後に事後平均推定値を制約セットに投影することを目的とした拡散ベースのサンプリング アルゴリズムである制約事後サンプリング (CPS) を導入します。
特に、CPS は追加のトレーニングを必要とせずに、多数の制約 (~100) に対応します。
私たちは、サンプリングに対する予測ステップの影響を強調する理論的根拠を提供します。
経験的に、CPS は、現実世界の株式、交通、大気質データセットにおけるサンプル品質とリアルタイム系列との類似性において、最先端の手法よりもそれぞれ約 10% と 42% 優れています。
要約(オリジナル)
Generating realistic time series samples is crucial for stress-testing models and protecting user privacy by using synthetic data. In engineering and safety-critical applications, these samples must meet certain hard constraints that are domain-specific or naturally imposed by physics or nature. Consider, for example, generating electricity demand patterns with constraints on peak demand times. This can be used to stress-test the functioning of power grids during adverse weather conditions. Existing approaches for generating constrained time series are either not scalable or degrade sample quality. To address these challenges, we introduce Constrained Posterior Sampling (CPS), a diffusion-based sampling algorithm that aims to project the posterior mean estimate into the constraint set after each denoising update. Notably, CPS scales to a large number of constraints (~100) without requiring additional training. We provide theoretical justifications highlighting the impact of our projection step on sampling. Empirically, CPS outperforms state-of-the-art methods in sample quality and similarity to real time series by around 10% and 42%, respectively, on real-world stocks, traffic, and air quality datasets.
arxiv情報
著者 | Sai Shankar Narasimhan,Shubhankar Agarwal,Litu Rout,Sanjay Shakkottai,Sandeep P. Chinchali |
発行日 | 2024-10-16 15:16:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google