要約
時系列のクラスタリングは、時系列データを同様の動作のあるグループに分類するための教師のない学習方法です。
これは、ヘルスケア、金融、経済、エネルギー、気候科学などのアプリケーションで使用されています。
いくつかの時系列クラスタリング方法が導入され、40年以上にわたって使用されています。
それらのほとんどは、時系列間のユークリッド距離または関連性のない測定に焦点を当てています。
この作業では、ランク付けされたピアソン相関の非類似性(RDPC)と呼ばれる新しい非類似度測定を提案します。これは、最大の要素ごとの違いの指定された割合の加重平均を、よく知られたピアソン相関の相関性と組み合わせます。
階層クラスタリングに組み込まれています。
パフォーマンスは評価され、既存のクラスタリングアルゴリズムと比較されます。
結果は、RDPCアルゴリズムが、さまざまな季節パターン、トレンド、ピークを含む複雑なケースで他の人を上回ることを示しています。
最後に、タイの電力消費時系列データセットから顧客のランダムなサンプルを一意の特性を持つ7つのグループにクラスター化することにより、私たちの方法を実証します。
要約(オリジナル)
Time series clustering is an unsupervised learning method for classifying time series data into groups with similar behavior. It is used in applications such as healthcare, finance, economics, energy, and climate science. Several time series clustering methods have been introduced and used for over four decades. Most of them focus on measuring either Euclidean distances or association dissimilarities between time series. In this work, we propose a new dissimilarity measure called ranked Pearson correlation dissimilarity (RDPC), which combines a weighted average of a specified fraction of the largest element-wise differences with the well-known Pearson correlation dissimilarity. It is incorporated into hierarchical clustering. The performance is evaluated and compared with existing clustering algorithms. The results show that the RDPC algorithm outperforms others in complicated cases involving different seasonal patterns, trends, and peaks. Finally, we demonstrate our method by clustering a random sample of customers from a Thai electricity consumption time series dataset into seven groups with unique characteristics.
arxiv情報
著者 | Chutiphan Charoensuk,Nathakhun Wiroonsri |
発行日 | 2025-05-07 15:39:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google