Knowledge Extraction with Interval Temporal Logic Decision Trees

要約

多変量時系列分類は、すべてのインスタンスが複数の値ではなく複数の時系列で記述されるため、ある意味、(数値) 分類の時間的一般化です。
記号分類は、データセットから明示的な知識を抽出するための機械学習戦略であり、多変量時系列の記号分類の問題には、アドホックな機械学習アルゴリズムの設計、実装、テストが必要です。
決定木の一時的なバージョンの抽出。
カテゴリ データから決定木を抽出するための最もよく知られたアルゴリズムの 1 つは Quinlan の ID3 です。これは後に数値属性を処理できるように拡張され、C4.5 として知られるアルゴリズムになり、多くのオープンソース データ マイニング ライブラリに実装されました。
これには、J48 と呼ばれる C4.5 の実装を特徴とするいわゆる Weka が含まれます。
ID3 は最近、多変量時系列の離散 (カテゴリ) バージョンと見なすことができるタイムラインの形式で時系列データを処理するために一般化されました。このような一般化は、間隔時相ロジック HS に基づいて、Temporal ID3 として知られています。
この論文では、非離散化多変量時系列から時間決定木の抽出を可能にする Temporal C4.5 を紹介し、Temporal J48 と呼ばれるその実装について説明し、公開データのコレクションに対する後者の一連の実験の結果について説明します。
セットを作成し、他の古典的な多変量時系列分類方法によって得られた結果と比較します。

要約(オリジナル)

Multivariate temporal, or time, series classification is, in a way, the temporal generalization of (numeric) classification, as every instance is described by multiple time series instead of multiple values. Symbolic classification is the machine learning strategy to extract explicit knowledge from a data set, and the problem of symbolic classification of multivariate temporal series requires the design, implementation, and test of ad-hoc machine learning algorithms, such as, for example, algorithms for the extraction of temporal versions of decision trees. One of the most well-known algorithms for decision tree extraction from categorical data is Quinlan’s ID3, which was later extended to deal with numerical attributes, resulting in an algorithm known as C4.5, and implemented in many open-sources data mining libraries, including the so-called Weka, which features an implementation of C4.5 called J48. ID3 was recently generalized to deal with temporal data in form of timelines, which can be seen as discrete (categorical) versions of multivariate time series, and such a generalization, based on the interval temporal logic HS, is known as Temporal ID3. In this paper we introduce Temporal C4.5, that allows the extraction of temporal decision trees from undiscretized multivariate time series, describe its implementation, called Temporal J48, and discuss the outcome of a set of experiments with the latter on a collection of public data sets, comparing the results with those obtained by other, classical, multivariate time series classification methods.

arxiv情報

著者 Guido Sciavicco,Stan Ionel Eduard
発行日 2023-05-26 12:15:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク