Real World Time Series Benchmark Datasets with Distribution Shifts: Global Crude Oil Price and Volatility

要約

金融分野ではタスクラベル付きの時系列ベンチマークが不足しているため、継続的な学習の進歩が妨げられています。
この赤字に対処することで、この分野のイノベーションが促進されるでしょう。
したがって、COB、原油ベンチマーク データセットを紹介します。
COB には、重大な分布の変化を示す 30 年間の資産価格が含まれており、世界で最も重要な 3 つの原油のこれらの分布の変化に基づいて、対応するタスク (つまり、体制) ラベルを最適に生成します。
私たちの貢献には、資産価格データをボラティリティ プロキシに変換することによる現実世界のベンチマーク データセットの作成、期待値最大化 (EM) を使用したモデルのフィッティング、現実世界のイベントに合わせたコンテキスト タスク ラベルの生成、およびこれらのラベルと一般的なアルゴリズムの提供が含まれます。
一般の人に。
これらのタスク ラベルを含めることで、複数の予測期間にわたって、最先端の 4 つの継続学習アルゴリズムのパフォーマンスが全般的に向上することを示します。
私たちは、特に考慮されている資産の世界的な重要性を考慮して、これらのベンチマークによって、実世界のデータの分布の変化に対処する研究が加速されることを願っています。
(1) 生の価格データ、(2) 私たちのアプローチによって生成されたタスク ラベル、(3) およびアルゴリズムのコードを https://oilpricebenchmarks.github.io で入手できるようにしました。

要約(オリジナル)

The scarcity of task-labeled time-series benchmarks in the financial domain hinders progress in continual learning. Addressing this deficit would foster innovation in this area. Therefore, we present COB, Crude Oil Benchmark datasets. COB includes 30 years of asset prices that exhibit significant distribution shifts and optimally generates corresponding task (i.e., regime) labels based on these distribution shifts for the three most important crude oils in the world. Our contributions include creating real-world benchmark datasets by transforming asset price data into volatility proxies, fitting models using expectation-maximization (EM), generating contextual task labels that align with real-world events, and providing these labels as well as the general algorithm to the public. We show that the inclusion of these task labels universally improves performance on four continual learning algorithms, some state-of-the-art, over multiple forecasting horizons. We hope these benchmarks accelerate research in handling distribution shifts in real-world data, especially due to the global importance of the assets considered. We’ve made the (1) raw price data, (2) task labels generated by our approach, (3) and code for our algorithm available at https://oilpricebenchmarks.github.io.

arxiv情報

著者 Pranay Pasula
発行日 2023-08-21 16:44:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク