Extended High Utility Pattern Mining: An Answer Set Programming Based Framework and Applications

要約

特定のデータセットから関連するパターンのセットを検出することは、データ マイニングにおける重要な課題です。
文献では有用性とも呼ばれるパターンの関連性は主観的な尺度であり、実際には非常に異なる観点から評価できます。
回答セット プログラミング (ASP) のようなルールベースの言語は、制約の形でパターンの有用性を評価するためにユーザーが提供する基準を指定するのに適しているようです。
さらに、ASP の宣言性により、さまざまな観点からデータセットを分析するために、いくつかの基準を非常に簡単に切り替えることができます。
このホワイト ペーパーでは、High Utility Pattern Mining (HUPM) の概念を拡張するための手順を示します。
特に、以前の文献では考慮されていなかった新しいクラスのユーティリティ基準を可能にする新しいフレームワークを導入します。
また、外部関数を使用した ASP の最近の拡張機能が、新しいフレームワークの迅速かつ効果的なエンコードとテストをどのようにサポートできるかを示します。
提案されたフレームワークの可能性を実証するために、COVID-19 患者の ICU 入院を予測するための革新的な方法を定義するためのビルディング ブロックとしてそれを活用します。
最後に、大規模な実験活動により、提案されたアプローチの有効性が定量的および定性的な観点から実証されました。
論理プログラミングの理論と実践 (TPLP) で検討中

要約(オリジナル)

Detecting sets of relevant patterns from a given dataset is an important challenge in data mining. The relevance of a pattern, also called utility in the literature, is a subjective measure and can be actually assessed from very different points of view. Rule-based languages like Answer Set Programming (ASP) seem well suited for specifying user-provided criteria to assess pattern utility in a form of constraints; moreover, declarativity of ASP allows for a very easy switch between several criteria in order to analyze the dataset from different points of view. In this paper, we make steps toward extending the notion of High Utility Pattern Mining (HUPM); in particular we introduce a new framework that allows for new classes of utility criteria not considered in the previous literature. We also show how recent extensions of ASP with external functions can support a fast and effective encoding and testing of the new framework. To demonstrate the potential of the proposed framework, we exploit it as a building block for the definition of an innovative method for predicting ICU admission for COVID-19 patients. Finally, an extensive experimental activity demonstrates both from a quantitative and a qualitative point of view the effectiveness of the proposed approach. Under consideration in Theory and Practice of Logic Programming (TPLP)

arxiv情報

著者 Francesco Cauteruccio,Giorgio Terracina
発行日 2023-03-23 11:42:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク