StiefelGen: A Simple, Model Agnostic Approach for Time Series Data Augmentation over Riemannian Manifolds

要約

データ拡張は、画像ベースの学習モデル、自動運転車の強化学習、点群データの一般的なノイズ注入など、多くの機械学習分野で活発な開発が行われている研究分野です。
しかし、特にこれらのモデル用に開発された手法は容易にクロスオーバーしないため、一般的な時系列データ拡張のための説得力のある手法にはまだ多くの要望が残されています。
時系列データを拡張するための 3 つの一般的なアプローチには、(i) 物理ベースのモデルを構築し、(たとえば) 係数空間に不確実性を加える、(ii) 観測されたデータ セットにノイズを追加する、および (iii)
) 堅牢な生成ニューラル ネットワーク モデルをトレーニングできる、豊富な量の時系列データ セットにアクセスできること。
ただし、業界で時系列データを扱う多くの実際的な問題については、(i) 通常、堅牢な物理モデルにアクセスできない、(ii) ノイズの追加自体が大規模または困難な仮定を必要とする可能性があります (たとえば、
(iii) 実際には、ニューラル ネットワーク モデルをトレーニングするために使用する大規模な代表的な時系列データベースを調達するのが難しい場合があります。
根本的な問題。
この論文では、これら 3 つの以前の制限すべてに同時に大きな範囲で対処しようとする方法論を提案します。
この方法は、時系列信号を多様体上に配置し、その後滑らかに摂動させる簡単な方法を提案するため、よく研究されたシュティーフェル多様体の行列微分幾何学に依存しています。
私たちは、特にこの基礎となる多様体の固有の特性を利用するために機能するいくつかの潜在的な使用例を紹介することによって、この方法がどのように機能するかを明らかにしようとします。

要約(オリジナル)

Data augmentation is an area of research which has seen active development in many machine learning fields, such as in image-based learning models, reinforcement learning for self driving vehicles, and general noise injection for point cloud data. However, convincing methods for general time series data augmentation still leaves much to be desired, especially since the methods developed for these models do not readily cross-over. Three common approaches for time series data augmentation include: (i) Constructing a physics-based model and then imbuing uncertainty over the coefficient space (for example), (ii) Adding noise to the observed data set(s), and, (iii) Having access to ample amounts of time series data sets from which a robust generative neural network model can be trained. However, for many practical problems that work with time series data in the industry: (i) One usually does not have access to a robust physical model, (ii) The addition of noise can in of itself require large or difficult assumptions (for example, what probability distribution should be used? Or, how large should the noise variance be?), and, (iii) In practice, it can be difficult to source a large representative time series data base with which to train the neural network model for the underlying problem. In this paper, we propose a methodology which attempts to simultaneously tackle all three of these previous limitations to a large extent. The method relies upon the well-studied matrix differential geometry of the Stiefel manifold, as it proposes a simple way in which time series signals can placed on, and then smoothly perturbed over the manifold. We attempt to clarify how this method works by showcasing several potential use cases which in particular work to take advantage of the unique properties of this underlying manifold.

arxiv情報

著者 Prasad Cheema,Mahito Sugiyama
発行日 2024-02-29 15:52:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク