要約
シグネチャ変換は、連続および離散時系列データの反復パス積分であり、その普遍的な非線形性により、特徴選択の問題が線形化されます。
この論文では、シグネチャ変換の Lasso 回帰の一貫性の問題を理論的にも数値的にも再検討します。
私たちの研究では、ブラウン運動や次元間の相関が弱いランダム ウォークに近いプロセスや時系列では、ラッソ回帰は It\^o 積分によって定義されたシグネチャに対してより一貫性があることが示されています。
平均復帰プロセスと時系列については、Stratonovich 積分によって定義されたそれらのシグネチャは、Lasso 回帰においてより一貫性があります。
私たちの調査結果は、統計的推論と機械学習におけるシグネチャと確率モデルの適切な定義を選択することの重要性を強調しています。
要約(オリジナル)
Signature transforms are iterated path integrals of continuous and discrete-time time series data, and their universal nonlinearity linearizes the problem of feature selection. This paper revisits the consistency issue of Lasso regression for the signature transform, both theoretically and numerically. Our study shows that, for processes and time series that are closer to Brownian motion or random walk with weaker inter-dimensional correlations, the Lasso regression is more consistent for their signatures defined by It\^o integrals; for mean reverting processes and time series, their signatures defined by Stratonovich integrals have more consistency in the Lasso regression. Our findings highlight the importance of choosing appropriate definitions of signatures and stochastic models in statistical inference and machine learning.
arxiv情報
著者 | Xin Guo,Ruixun Zhang,Chaoyi Zhao |
発行日 | 2023-05-17 17:48:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google