Robust incremental learning pipelines for temporal tabular datasets with distribution shifts


自己相似性の概念を使用するこのモデルでは、機械学習モデルの 2 つの基本的な構成要素 (勾配ブースティング デシジョン ツリーとニューラル ネットワーク) のみを使用して、必要な複雑さに対応したモデルを構築します。
このモデルは、特殊なニューラル アーキテクチャが使用されておらず、各モデル構成ブロックを独立して並行してトレーニングできるため、効率的です。


In this paper, we present a robust incremental learning model for regression tasks on temporal tabular datasets. Using commonly available tabular and time-series prediction models as building blocks, a machine-learning model is built incrementally to adapt to distributional shifts in data. Using the concept of self-similarity, the model uses only two basic building blocks of machine learning models, gradient boosting decision trees and neural networks to build models for any required complexity. The model is efficient as no specialised neural architectures are used and each model building block can be independently trained in parallel. The model is demonstrated to have robust performances under adverse situations such as regime changes, fat-tailed distributions and low signal-to-noise ratios. Model robustness are studied under different hyper-parameters and complexities.


著者 Thomas Wong,Mauricio Barahona
発行日 2023-05-18 14:01:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, q-fin.MF パーマリンク