Bake off redux: a review and experimental evaluation of recent time series classification algorithms

要約

2017 年の研究論文では、カリフォルニア大学リバーサイド校 (UCR) アーカイブの 85 のデータセットで 18 の時系列分類 (TSC) アルゴリズムを比較しました。
一般に「ベイクオフ」と呼ばれるこの調査では、使用されたダイナミック タイム ワーピング (DTW) および回転フォレストのベンチマークよりも大幅に優れたパフォーマンスを示したアルゴリズムは 9 つだけであることが特定されました。
この研究では、時系列データから抽出する特徴の種類によって各アルゴリズムを分類し、5 つの主要なアルゴリズム タイプの分類を形成しました。
このアルゴリズムの分類と、再現性のためのコードとアクセス可能な結果の提供は、TSC 分野の人気の高まりを促進するのに役立ちました。
このベイクオフから 6 年以上が経過し、UCR アーカイブは 112 のデータセットに拡大し、多数の新しいアルゴリズムが提案されました。
ベイクオフを再検討して、提案された各カテゴリが最初の出版物からどのように進歩したかを確認し、拡張された UCR アーカイブを使用して、以前のカテゴリの最高のものと比較して新しいアルゴリズムのパフォーマンスを評価します。
最近の展開を反映するために、分類法を拡張して 3 つの新しいカテゴリを含めます。
当初提案された距離、間隔、シェイプレット、辞書およびハイブリッド ベースのアルゴリズムに加えて、新しい畳み込みおよび特徴ベースのアルゴリズム、および深層学習アプローチを比較します。
最近アーカイブに寄贈された、または TSC 形式に再フォーマットされた 30 の分類データセットを導入し、これらを使用して各カテゴリから最もパフォーマンスの高いアルゴリズムをさらに評価します。
全体として、最近提案された 2 つのアルゴリズム、Hydra+MultiROCKET と HIVE-COTEv2 が、現在および新しい TSC 問題の両方において他のアプローチよりも大幅に優れたパフォーマンスを発揮することがわかりました。

要約(オリジナル)

In 2017, a research paper compared 18 Time Series Classification (TSC) algorithms on 85 datasets from the University of California, Riverside (UCR) archive. This study, commonly referred to as a `bake off’, identified that only nine algorithms performed significantly better than the Dynamic Time Warping (DTW) and Rotation Forest benchmarks that were used. The study categorised each algorithm by the type of feature they extract from time series data, forming a taxonomy of five main algorithm types. This categorisation of algorithms alongside the provision of code and accessible results for reproducibility has helped fuel an increase in popularity of the TSC field. Over six years have passed since this bake off, the UCR archive has expanded to 112 datasets and there have been a large number of new algorithms proposed. We revisit the bake off, seeing how each of the proposed categories have advanced since the original publication, and evaluate the performance of newer algorithms against the previous best-of-category using an expanded UCR archive. We extend the taxonomy to include three new categories to reflect recent developments. Alongside the originally proposed distance, interval, shapelet, dictionary and hybrid based algorithms, we compare newer convolution and feature based algorithms as well as deep learning approaches. We introduce 30 classification datasets either recently donated to the archive or reformatted to the TSC format, and use these to further evaluate the best performing algorithm from each category. Overall, we find that two recently proposed algorithms, Hydra+MultiROCKET and HIVE-COTEv2, perform significantly better than other approaches on both the current and new TSC problems.

arxiv情報

著者 Matthew Middlehurst,Patrick Schäfer,Anthony Bagnall
発行日 2024-05-08 15:33:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク