Efficient Model Selection for Predictive Pattern Mining Model by Safe Pattern Pruning

要約

予測パターン マイニングは、入力がセット、グラフ、シーケンスなどの構造化データで表される場合に、予測モデルを構築するために使用されるアプローチです。
予測パターン マイニングの背後にある主な考え方は、構造化データ内に存在するサブセット、サブグラフ、サブシーケンス (パターンと呼ばれる) などの部分構造をモデルの特徴として考慮して予測モデルを構築することです。
予測パターンマイニングにおける主な課題は、構造化データの複雑化に伴いパターン数が指数関数的に増加することにあります。
この研究では、予測パターン マイニングにおけるパターン数の爆発的な増加に対処するために、安全なパターン プルーニング (SPP) 手法を提案します。
また、実際のデータ分析におけるモデル構築プロセス全体を通じて、それを効果的に使用する方法についても説明します。
提案手法の有効性を実証するために、集合、グラフ、数列を含む回帰および分類問題について数値実験を行います。

要約(オリジナル)

Predictive pattern mining is an approach used to construct prediction models when the input is represented by structured data, such as sets, graphs, and sequences. The main idea behind predictive pattern mining is to build a prediction model by considering substructures, such as subsets, subgraphs, and subsequences (referred to as patterns), present in the structured data as features of the model. The primary challenge in predictive pattern mining lies in the exponential growth of the number of patterns with the complexity of the structured data. In this study, we propose the Safe Pattern Pruning (SPP) method to address the explosion of pattern numbers in predictive pattern mining. We also discuss how it can be effectively employed throughout the entire model building process in practical data analysis. To demonstrate the effectiveness of the proposed method, we conduct numerical experiments on regression and classification problems involving sets, graphs, and sequences.

arxiv情報

著者 Takumi Yoshida,Hiroyuki Hanada,Kazuya Nakagawa,Kouichi Taji,Koji Tsuda,Ichiro Takeuchi
発行日 2023-06-23 15:34:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク