要約
時系列データ間の距離や類似性の測定は、分類、クラスタリング、アンサンブル/位置合わせなどの多くのアプリケーションの基本的な側面です。
既存の尺度では、局所的な傾向 (形状) 間の類似性を捉えることができず、誤解を招く結果が生じる可能性さえあります。
私たちの目標は、同様の時期に発生した同様の傾向を探し、応用分野の研究者にとって容易に解釈できる尺度を開発することです。
これは、流行(急増、増加、ピーク、減少)など、時系列に順序付けられた一連の意味のあるローカル傾向があるアプリケーションに特に役立ちます。
我々は、新しい尺度である DTW+S を提案します。これは、各列が局所的な傾向を表す、時系列の解釈可能な「近さ維持」行列表現を作成し、動的タイムワーピングを適用してこれらの行列間の距離を計算します。
この表現の選択を裏付ける理論的分析を紹介します。
いくつかのタスクで DTW+S の有用性を示します。
流行曲線のクラスタリングについては、DTW+S がベースラインと比較して良好なクラスタリングを生成できる唯一の尺度であることを示します。
アンサンブル構築については、基礎となる軌道の特性を最適に保存する DTW+S と重心平均化の組み合わせを提案します。
また、特に規模ではなく局所的な傾向が決定的な役割を果たす場合、データセットのクラスに対して、このアプローチが動的タイムワーピングと比較してより優れた分類をもたらすことも示します。
要約(オリジナル)
Measuring distance or similarity between time-series data is a fundamental aspect of many applications including classification, clustering, and ensembling/alignment. Existing measures may fail to capture similarities among local trends (shapes) and may even produce misleading results. Our goal is to develop a measure that looks for similar trends occurring around similar times and is easily interpretable for researchers in applied domains. This is particularly useful for applications where time-series have a sequence of meaningful local trends that are ordered, such as in epidemics (a surge to an increase to a peak to a decrease). We propose a novel measure, DTW+S, which creates an interpretable ‘closeness-preserving’ matrix representation of the time-series, where each column represents local trends, and then it applies Dynamic Time Warping to compute distances between these matrices. We present a theoretical analysis that supports the choice of this representation. We demonstrate the utility of DTW+S in several tasks. For the clustering of epidemic curves, we show that DTW+S is the only measure able to produce good clustering compared to the baselines. For ensemble building, we propose a combination of DTW+S and barycenter averaging that results in the best preservation of characteristics of the underlying trajectories. We also demonstrate that our approach results in better classification compared to Dynamic Time Warping for a class of datasets, particularly when local trends rather than scale play a decisive role.
arxiv情報
著者 | Ajitesh Srivastava |
発行日 | 2023-11-29 13:21:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google