Process Mining Embeddings: Learning Vector Representations for Petri Nets

要約

プロセスマイニングは、実世界のビジネスプロセスを発見、分析、強化するための強力な技術を提供する。この文脈において、ペトリネットはプロセスの振る舞いをモデル化する表現力を提供する。しかし、複雑なペトリネットを直接分析し比較することは困難である。本研究では、Doc2Vecに触発された自然言語処理の概念に基づき、埋め込みベクトルとして表現されるプロセスモデルの効果的な比較、クラスタリング、分類を容易にするように設計された、新しい教師なし手法であるPetriNet2Vecを紹介する。これらの埋め込みベクトルにより、異なるプロセスモデル間の類似性と関係性を定量化することができる。我々の手法は、96個の多様なペトリネットモデルを含むPDCデータセットを用いて実験的に検証された。クラスタ分析を行い、UMAP可視化を作成し、決定木を訓練して、PetriNet2Vecがプロセスモデルとその構成タスクの間の意味のあるパターンと関係を識別できることの説得力のある証拠を提供した。一連の実験を通して、我々はPetriNet2Vecがペトリネットの構造を学習できること、そして我々のデータセットのプロセスモデルをシミュレートするために使われる主要な特性を学習できることを実証した。さらに、我々の結果は、プロセスマイニングの強化における2つの重要な下流タスク、すなわちプロセスの分類とプロセス検索において、学習された埋め込みが有用であることを示す。

要約(オリジナル)

Process mining offers powerful techniques for discovering, analyzing, and enhancing real-world business processes. In this context, Petri nets provide an expressive means of modeling process behavior. However, directly analyzing and comparing intricate Petri net presents challenges. This study introduces PetriNet2Vec, a novel unsupervised methodology based on Natural Language Processing concepts inspired by Doc2Vec and designed to facilitate the effective comparison, clustering, and classification of process models represented as embedding vectors. These embedding vectors allow us to quantify similarities and relationships between different process models. Our methodology was experimentally validated using the PDC Dataset, featuring 96 diverse Petri net models. We performed cluster analysis, created UMAP visualizations, and trained a decision tree to provide compelling evidence for the capability of PetriNet2Vec to discern meaningful patterns and relationships among process models and their constituent tasks. Through a series of experiments, we demonstrated that PetriNet2Vec was capable of learning the structure of Petri nets, as well as the main properties used to simulate the process models of our dataset. Furthermore, our results showcase the utility of the learned embeddings in two crucial downstream tasks within process mining enhancement: process classification and process retrieval.

arxiv情報

著者 Juan G. Colonna,Ahmed A. Fares,Márcio Duarte,Ricardo Sousa
発行日 2024-05-03 13:33:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI パーマリンク