Generating the Traces You Need: A Conditional Generative Model for Process Mining Data

要約

近年、トレース生成がプロセス マイニング コミュニティ内の重要な課題として浮上しています。
ディープラーニング (DL) モデルは、選択されたプロセスの特徴を正確に再現することが実証されています。
ただし、現在の DL 生成モデルは、学習した分布を適応させて特定の条件や属性に基づいてデータ サンプルを生成する能力に限界があります。
生成されるデータのタイプを制御する機能はさまざまな状況で有益であり、特定の動作に焦点を当てたり、頻度の低いパターンを探索したり、代替の「仮定」シナリオをシミュレーションしたりできるため、この制限は特に重要です。
この研究では、条件付き変分オートエンコーダー (CVAE) に基づくプロセス データ生成の条件付きモデルを導入することで、この課題に対処します。
条件付きモデルは、入力条件変数を調整することで生成プロセスを制御し、よりターゲットを絞った制御されたデータ生成を可能にします。
他のドメインとは異なり、プロセス マイニングの CVAE は、データの多視点の性質と、データの可変性を確保しながら制御フロー ルールに従う必要があるため、特有の課題に直面しています。
具体的には、制御フローとトレースの時間的特徴を条件としたプロセス実行の生成に重点を置き、特定の識別されたサブプロセスのトレースを生成できるようにします。
生成されたトレースは、条件付き生成の品質を評価するための追加のメトリックとともに、生成モデル評価の一般的なメトリックを使用して評価されます。

要約(オリジナル)

In recent years, trace generation has emerged as a significant challenge within the Process Mining community. Deep Learning (DL) models have demonstrated accuracy in reproducing the features of the selected processes. However, current DL generative models are limited in their ability to adapt the learned distributions to generate data samples based on specific conditions or attributes. This limitation is particularly significant because the ability to control the type of generated data can be beneficial in various contexts, enabling a focus on specific behaviours, exploration of infrequent patterns, or simulation of alternative ‘what-if’ scenarios. In this work, we address this challenge by introducing a conditional model for process data generation based on a conditional variational autoencoder (CVAE). Conditional models offer control over the generation process by tuning input conditional variables, enabling more targeted and controlled data generation. Unlike other domains, CVAE for process mining faces specific challenges due to the multiperspective nature of the data and the need to adhere to control-flow rules while ensuring data variability. Specifically, we focus on generating process executions conditioned on control flow and temporal features of the trace, allowing us to produce traces for specific, identified sub-processes. The generated traces are then evaluated using common metrics for generative model assessment, along with additional metrics to evaluate the quality of the conditional generation

arxiv情報

著者 Riccardo Graziosi,Massimiliano Ronzani,Andrei Buliga,Chiara Di Francescomarino,Francesco Folino,Chiara Ghidini,Francesca Meneghello,Luigi Pontieri
発行日 2024-11-04 14:44:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LG パーマリンク