Proximity Forest 2.0: A new effective and scalable similarity-based classifier for time series

要約

【タイトル】
Proximity Forest 2.0:タイムシリーズ向けの新しい効果的かつ拡張可能な類似度ベース分類器

【要約】
– タイムシリーズ分類(TSC)は、傾向、分散、周波数、大きさ、様々なパターンを含む、さまざまな分類タスクにおいて、関連する特徴の種類の多様性のために難しい
– この課題に対処するため、類似度ベース、特徴・区間、シェイプレット、辞書、カーネル、ニューラルネットワーク、ハイブリッドアプローチなど、いくつかの代替的なアプローチが開発されてきた
– PF2.0は、3つの最近のタイムシリーズ類似性尺度の進展を取り込んで、(1)効率的な早期中止と剪定、(2)新しいタイムワーピングを用いた弾性尺度、「アメルシッド・ダイナミック・タイム・ワーピング(ADTW)」、そして(3)コスト関数の調整を組み合わせ、これまでの最先端の類似度ベース分類器を上回った
– PF2.0は、元のPFの8つの基本尺度を3つに簡素化し、すべての類似度尺度で最初の微分変換を使用することで、統合された尺度セットを合理化している
– PF1.0とPF2.0をシングルC++フレームワークで実装しており、PFフレームワークをより効率的にすることができる。UCRベンチマークにおいて、PF2.0は特定のデータセットにおいて、カーネル、ニューラルネットワーク、ハイブリッド法よりも、類似性ベースの方法で最適実施される。

要約(オリジナル)

Time series classification (TSC) is a challenging task due to the diversity of types of feature that may be relevant for different classification tasks, including trends, variance, frequency, magnitude, and various patterns. To address this challenge, several alternative classes of approach have been developed, including similarity-based, features and intervals, shapelets, dictionary, kernel, neural network, and hybrid approaches. While kernel, neural network, and hybrid approaches perform well overall, some specialized approaches are better suited for specific tasks. In this paper, we propose a new similarity-based classifier, Proximity Forest version 2.0 (PF 2.0), which outperforms previous state-of-the-art similarity-based classifiers across the UCR benchmark and outperforms state-of-the-art kernel, neural network, and hybrid methods on specific datasets in the benchmark that are best addressed by similarity-base methods. PF 2.0 incorporates three recent advances in time series similarity measures — (1) computationally efficient early abandoning and pruning to speedup elastic similarity computations; (2) a new elastic similarity measure, Amerced Dynamic Time Warping (ADTW); and (3) cost function tuning. It rationalizes the set of similarity measures employed, reducing the eight base measures of the original PF to three and using the first derivative transform with all similarity measures, rather than a limited subset. We have implemented both PF 1.0 and PF 2.0 in a single C++ framework, making the PF framework more efficient.

arxiv情報

著者 Matthieu Herrmann,Chang Wei Tan,Mahsa Salehi,Geoffrey I. Webb
発行日 2023-04-13 04:35:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク