Proximity Forest 2.0: A new effective and scalable similarity-based classifier for time series

要約

タイトル:時系列に対する新たな効果的でスケーラブルな類似性ベースの分類器、Proximity Forest 2.0

要約:
– 時系列分類(TSC)は、トレンド、分散、周波数、大きさ、様々なパターンなど、さまざまなタイプの特徴が異なる分類タスクに関連するため、課題があります。
– 同様に、類似性ベース、特徴、インターバル、シェイプレット、ディクショナリ、カーネル、ニューラルネットワーク、ハイブリッドアプローチなど、いくつかの代替アプローチが開発されています。
– カーネル、ニューラルネットワーク、ハイブリッドアプローチは全体的に優れているが、特定のタスクに最適な特殊なアプローチもある。
– この論文では、Proximity Forestバージョン2.0(PF 2.0)という新しい類似性ベースの分類器を提案します。UCRベンチマーク全体で、従来の最先端の類似性ベースの分類器よりも優れ、類似性ベースの方法が最適なベンチマークの特定のデータセットでは、最先端のカーネル、ニューラルネットワーク、ハイブリッド手法よりも優れています。
– PF 2.0は、時系列類似性の3つの最近の進歩を統合しています。
1. 計算効率の良い早期放棄と枝刈りを組み合わせて、弾性類似性計算を高速化する。
2. 新しい弾性類似性測度、Amerced Dynamic Time Warping(ADTW)。
3. コスト関数の調整。
– PF 1.0とPF 2.0の両方をC ++フレームワークで実装しており、効率的なPFフレームワークを提供しています。

要約(オリジナル)

Time series classification (TSC) is a challenging task due to the diversity of types of feature that may be relevant for different classification tasks, including trends, variance, frequency, magnitude, and various patterns. To address this challenge, several alternative classes of approach have been developed, including similarity-based, features and intervals, shapelets, dictionary, kernel, neural network, and hybrid approaches. While kernel, neural network, and hybrid approaches perform well overall, some specialized approaches are better suited for specific tasks. In this paper, we propose a new similarity-based classifier, Proximity Forest version 2.0 (PF 2.0), which outperforms previous state-of-the-art similarity-based classifiers across the UCR benchmark and outperforms state-of-the-art kernel, neural network, and hybrid methods on specific datasets in the benchmark that are best addressed by similarity-base methods. PF 2.0 incorporates three recent advances in time series similarity measures — (1) computationally efficient early abandoning and pruning to speedup elastic similarity computations; (2) a new elastic similarity measure, Amerced Dynamic Time Warping (ADTW); and (3) cost function tuning. It rationalizes the set of similarity measures employed, reducing the eight base measures of the original PF to three and using the first derivative transform with all similarity measures, rather than a limited subset. We have implemented both PF 1.0 and PF 2.0 in a single C++ framework, making the PF framework more efficient.

arxiv情報

著者 Matthieu Herrmann,Chang Wei Tan,Mahsa Salehi,Geoffrey I. Webb
発行日 2023-04-12 12:22:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク