要約
マルチユーザー データセットの生成モデリングは、科学と工学の分野で注目を集めています。
特定のユーザーのデータ ポイントを生成するには、ユーザー情報を使用する必要がありますが、変分オートエンコーダー (VAE) を含む従来の生成モデルでは、それが無視されることがよくあります。
このペーパーでは、ユーザーの埋め込みを利用してユーザーガイド付きデータを生成する新しい条件付き生成モデルである GUIDE-VAE を紹介します。
GUIDE-VAE は、モデルがユーザー間で共有されたパターンからメリットを享受できるようにすることで、データの不均衡が顕著な場合でも、マルチユーザー設定でのパフォーマンスを向上させます。
ユーザー情報の統合に加えて、GUIDE-VAE にはパターン ディクショナリ ベースの共分散合成 (PDCC) が組み込まれており、複雑な特徴の依存関係を把握することで、生成されたサンプルの現実性が向上します。
ユーザーの埋め込みによってパフォーマンスが向上する一方で、PDCC は、VAE でよく見られるノイズや過剰な平滑化などの一般的な問題に対処します。
提案された GUIDE-VAE は、ユーザー間の実質的なデータの不均衡を特徴とするマルチユーザー スマート メーター データセットで評価されました。
定量的な結果は、GUIDE-VAE が合成データ生成と欠落レコード補完タスクの両方で効果的に機能することを示し、定性的評価では、GUIDE-VAE がより妥当でノイズの少ないデータを生成することが明らかになりました。
これらの結果により、GUIDE-VAE は、マルチユーザー データセットで制御された現実的なデータ生成のための有望なツールとして確立され、ユーザー情報に基づいたモデリングを必要とするさまざまなドメインにわたる潜在的なアプリケーションが可能になります。
要約(オリジナル)
Generative modelling of multi-user datasets has become prominent in science and engineering. Generating a data point for a given user requires employing user information, and conventional generative models, including variational autoencoders (VAEs), often ignore that. This paper introduces GUIDE-VAE, a novel conditional generative model that leverages user embeddings to generate user-guided data. By allowing the model to benefit from shared patterns across users, GUIDE-VAE enhances performance in multi-user settings, even under significant data imbalance. In addition to integrating user information, GUIDE-VAE incorporates a pattern dictionary-based covariance composition (PDCC) to improve the realism of generated samples by capturing complex feature dependencies. While user embeddings drive performance gains, PDCC addresses common issues such as noise and over-smoothing typically seen in VAEs. The proposed GUIDE-VAE was evaluated on a multi-user smart meter dataset characterized by substantial data imbalance across users. Quantitative results show that GUIDE-VAE performs effectively in both synthetic data generation and missing record imputation tasks, while qualitative evaluations reveal that GUIDE-VAE produces more plausible and less noisy data. These results establish GUIDE-VAE as a promising tool for controlled, realistic data generation in multi-user datasets, with potential applications across various domains requiring user-informed modelling.
arxiv情報
著者 | Kutay Bölat,Simon Tindemans |
発行日 | 2024-11-06 14:11:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google