要約
イベントシーケンスの要約は、データマイニングの重要な側面です。
ほとんどの既存の方法は、条件付き依存関係を無視し、シーケンシャルパターンのみを発見することに焦点を当てています。
この論文では、イベントシーケンスデータから条件付きおよび無条件の両方の依存関係を発見する問題を検討します。
フォーム$ x \ rightArrow y $のルールを発見することにより、$ x $と$ y $がシーケンシャルパターンです。
このようなルールは、前件と結果としての関係の明確な説明を理解するのが簡単であり、提供されます。
簡潔で非冗長なルールのセットを発見するために、最小説明長の原則の観点から問題を形式化します。
検索スペースは膨大であり、有用な構造を示していないため、実際に高品質のルールセットを発見するためのseqretメソッドを提案します。
広範な経験的評価を通じて、最新技術とは異なり、合成データセットでグラウンドトゥルースをうまく回復し、実際のデータセットから有用なルールを見つけることを示しています。
要約(オリジナル)
Summarizing event sequences is a key aspect of data mining. Most existing methods neglect conditional dependencies and focus on discovering sequential patterns only. In this paper, we study the problem of discovering both conditional and unconditional dependencies from event sequence data. We do so by discovering rules of the form $X \rightarrow Y$ where $X$ and $Y$ are sequential patterns. Rules like these are simple to understand and provide a clear description of the relation between the antecedent and the consequent. To discover succinct and non-redundant sets of rules we formalize the problem in terms of the Minimum Description Length principle. As the search space is enormous and does not exhibit helpful structure, we propose the Seqret method to discover high-quality rule sets in practice. Through extensive empirical evaluation we show that unlike the state of the art, Seqret ably recovers the ground truth on synthetic datasets and finds useful rules from real datasets.
arxiv情報
著者 | Aleena Siji,Joscha Cüppers,Osman Ali Mian,Jilles Vreeken |
発行日 | 2025-05-09 13:44:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google