Building a Multivariate Time Series Benchmarking Datasets Inspired by Natural Language Processing (NLP)

要約

時系列分析はさまざまな分野でますます重要になっており、効果的なモデルの開発は高品質のベンチマーク データセットに大きく依存しています。
事前トレーニング済みモデルの進歩における自然言語処理 (NLP) ベンチマーク データセットの成功に触発され、時系列分析用の包括的なベンチマーク データセットを作成する新しいアプローチを提案します。
このペーパーでは、NLP ベンチマーク データセットの作成に使用される方法論を検討し、それを時系列データ特有の課題に適応させます。
多様で代表的で困難な時系列データセットを厳選するプロセスについて説明し、ドメインの関連性とデータの複雑さの重要性を強調します。
さらに、ベンチマーク データセットを活用して時系列モデルのパフォーマンスを向上させるマルチタスク学習戦略を調査します。
この研究は、NLP ドメインの成功した戦略を採用することで、最先端の時系列モデリングを進歩させるという広範な目標に貢献します。

要約(オリジナル)

Time series analysis has become increasingly important in various domains, and developing effective models relies heavily on high-quality benchmark datasets. Inspired by the success of Natural Language Processing (NLP) benchmark datasets in advancing pre-trained models, we propose a new approach to create a comprehensive benchmark dataset for time series analysis. This paper explores the methodologies used in NLP benchmark dataset creation and adapts them to the unique challenges of time series data. We discuss the process of curating diverse, representative, and challenging time series datasets, highlighting the importance of domain relevance and data complexity. Additionally, we investigate multi-task learning strategies that leverage the benchmark dataset to enhance the performance of time series models. This research contributes to the broader goal of advancing the state-of-the-art in time series modeling by adopting successful strategies from the NLP domain.

arxiv情報

著者 Mohammad Asif Ibna Mustafa,Ferdinand Heinrich
発行日 2024-10-14 16:25:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク