Benchmarking optimality of time series classification methods in distinguishing diffusions

要約

タイトル:時系列分類手法における最適性のベンチマーク – 拡散現象の分類能力を用いた検証 –

要約:

– 時系列分類(TSC)アルゴリズムの解析と設計において、統計的最適性のベンチマークは重要である。
– 本研究では、尤度比検定(LRT)を用いて、TSCアルゴリズムの最適性を拡散現象の分類能力をベンチマークすることを提案している。
– LRTはNeyman-Pearsonの補題による最適分類器であり、トレーニングが必要なく、拡散現象を効率的にシミュレーションできる。
– 本研究では、ランダムフォレスト、ResNet、ROCKETの3つの広く用いられているTSCアルゴリズムをLRTでベンチマークしている。これらのアルゴリズムは、単変量時系列と多変量ガウス過程ではLRTの最適性を実現できるが、高次元非線形多変量時系列の分類においてはサブオプティマルである。
– LRTベンチマークは、時間長、次元、時間サンプリング周波数、時系列のランダム性といった分類精度の依存関係を解析するツールを提供する。

要約(オリジナル)

Statistical optimality benchmarking is crucial for analyzing and designing time series classification (TSC) algorithms. This study proposes to benchmark the optimality of TSC algorithms in distinguishing diffusion processes by the likelihood ratio test (LRT). The LRT is an optimal classifier by the Neyman-Pearson lemma. The LRT benchmarks are computationally efficient because the LRT does not need training, and the diffusion processes can be efficiently simulated and are flexible to reflect the specific features of real-world applications. We demonstrate the benchmarking with three widely-used TSC algorithms: random forest, ResNet, and ROCKET. These algorithms can achieve the LRT optimality for univariate time series and multivariate Gaussian processes. However, these model-agnostic algorithms are suboptimal in classifying high-dimensional nonlinear multivariate time series. Additionally, the LRT benchmark provides tools to analyze the dependence of classification accuracy on the time length, dimension, temporal sampling frequency, and randomness of the time series.

arxiv情報

著者 Zehong Zhang,Fei Lu,Esther Xu Fei,Terry Lyons,Yannis Kevrekidis,Tom Woolf
発行日 2023-04-12 03:49:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: 62M02, 62M10, 62M20, cs.LG, stat.ML パーマリンク