Contrastive Shapelet Learning for Unsupervised Multivariate Time Series Representation Learning

要約

最近の研究では、多変量時系列の教師なし表現学習 (URL) に大きな期待が寄せられています。これは、URL には、アクセスできないラベルを使用せずに多くの下流タスクの一般化可能な表現を学習する機能があるためです。
ただし、既存のアプローチは通常、時系列データをエンコードするために元々他の領域 (コンピューター ビジョンなど) 用に設計されたモデルを採用し、強力な仮定に依存して学習目標を設計するため、適切に実行する能力が制限されます。
これらの問題に対処するために、一般的な対比学習パラダイムを通じて時系列固有のシェイプレットベースの表現を学習することにより、多変量時系列用の新しい URL フレームワークを提案します。
私たちの知る限り、これは教師なし汎用表現学習におけるシェイプレットベースの埋め込みを調査した最初の研究です。
統合されたシェイプレットベースのエンコーダと、マルチグレインコントラストとマルチスケールアライメントを備えた新しい学習目標は、特に目標を達成するために設計されており、一般化を改善するためにデータ拡張ライブラリが採用されています。
私たちは、分類、クラスタリング、異常検出などの多くの下流タスクの表現品質を評価するために、数十の実世界のデータセットを使用して広範な実験を実施しています。
この結果は、UR​​L の競合他社だけでなく、下流のタスク用に特別に設計された技術に対しても、私たちの方法が優れていることを示しています。
私たちのコードは https://github.com/real2fish/CSL で公開されています。

要約(オリジナル)

Recent studies have shown great promise in unsupervised representation learning (URL) for multivariate time series, because URL has the capability in learning generalizable representation for many downstream tasks without using inaccessible labels. However, existing approaches usually adopt the models originally designed for other domains (e.g., computer vision) to encode the time series data and rely on strong assumptions to design learning objectives, which limits their ability to perform well. To deal with these problems, we propose a novel URL framework for multivariate time series by learning time-series-specific shapelet-based representation through a popular contrasting learning paradigm. To the best of our knowledge, this is the first work that explores the shapelet-based embedding in the unsupervised general-purpose representation learning. A unified shapelet-based encoder and a novel learning objective with multi-grained contrasting and multi-scale alignment are particularly designed to achieve our goal, and a data augmentation library is employed to improve the generalization. We conduct extensive experiments using tens of real-world datasets to assess the representation quality on many downstream tasks, including classification, clustering, and anomaly detection. The results demonstrate the superiority of our method against not only URL competitors, but also techniques specially designed for downstream tasks. Our code has been made publicly available at https://github.com/real2fish/CSL.

arxiv情報

著者 Zhiyu Liang,Jianfeng Zhang,Chen Liang,Hongzhi Wang,Zheng Liang,Lujia Pan
発行日 2023-06-01 17:16:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク