Automatic Feature Engineering for Time Series Classification: Evaluation and Discussion

要約

時系列分類 (TSC) は過去 20 年間で多くの注目を集めてきましたが、依然としてデータ サイエンスと知識エンジニアリングにおいて重要かつ困難な問題です。
実際、時系列データの利用可能性の増加に伴い、多くの TSC アルゴリズムが研究コミュニティによって文献で提案されています。
類似性測定、間隔、シェイプレット、辞書、深層学習法、またはハイブリッド アンサンブル法に基づく最先端の手法に加えて、教師なしの有益な要約統計量 (別名特徴) を時系列から抽出するためのいくつかのツールが近年設計されています。

元々は、有益で解釈可能な特徴を備えた時系列の記述分析と視覚化を目的として設計されましたが、これらの特徴エンジニアリング ツールのうち、TSC 問題のベンチマークが行われ、予測パフォーマンスの観点から最先端の TSC アルゴリズムと比較されたものはほとんどありません。
この記事では、このギャップを埋めることを目的として、既存の特徴エンジニアリング ツールで取得された特徴セットの潜在的な予測パフォーマンスを評価するための単純な TSC プロセスを提案します。
したがって、112 の時系列データセットにわたる 9 つの教師付き分類器で分岐した 11 の特徴量エンジニアリング ツールの実証的研究を紹介します。
10,000 を超える学習実験の結果の分析は、特徴ベースの手法が現在の最先端の TSC アルゴリズムと同じくらい正確に実行されることを示しており、したがって、当然のことながら TSC 文献でさらに検討されるべきです。

要約(オリジナル)

Time Series Classification (TSC) has received much attention in the past two decades and is still a crucial and challenging problem in data science and knowledge engineering. Indeed, along with the increasing availability of time series data, many TSC algorithms have been suggested by the research community in the literature. Besides state-of-the-art methods based on similarity measures, intervals, shapelets, dictionaries, deep learning methods or hybrid ensemble methods, several tools for extracting unsupervised informative summary statistics, aka features, from time series have been designed in the recent years. Originally designed for descriptive analysis and visualization of time series with informative and interpretable features, very few of these feature engineering tools have been benchmarked for TSC problems and compared with state-of-the-art TSC algorithms in terms of predictive performance. In this article, we aim at filling this gap and propose a simple TSC process to evaluate the potential predictive performance of the feature sets obtained with existing feature engineering tools. Thus, we present an empirical study of 11 feature engineering tools branched with 9 supervised classifiers over 112 time series data sets. The analysis of the results of more than 10000 learning experiments indicate that feature-based methods perform as accurately as current state-of-the-art TSC algorithms, and thus should rightfully be considered further in the TSC literature.

arxiv情報

著者 Aurélien Renault,Alexis Bondu,Vincent Lemaire,Dominique Gay
発行日 2023-08-02 10:46:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク