Data Augmentation techniques in time series domain: A survey and taxonomy

要約

深層学習ベースの生成モデルの最新の進歩により、時系列の分野でその驚くべきパフォーマンスを活用するのにそれほど時間はかかりませんでした。
時系列の処理に使用されるディープ ニューラル ネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存します。
これらの機能は通常、現実の世界では豊富ではなく、通常は制限されており、多くの場合、保証する必要のある制約があります。
したがって、データの量を増やす効果的な方法は、ノイズまたは順列を追加し、新しい合成データを生成することによって、データ拡張技術を使用することです。
この作業は、この分野の現在の最先端技術を体系的にレビューして、利用可能なすべてのアルゴリズムの概要を提供し、最も関連性の高い研究の分類法を提案します。
さまざまなバリアントの効率がプロセスの中心として評価され、パフォーマンスを評価するためのさまざまな指標と、各モデルに関する主な問題が分析されます。
この研究の最終的な目的は、この分野の将来の研究者を導くために、より良い結果を生み出す分野の進化とパフォーマンスの要約を提供することです。

要約(オリジナル)

With the latest advances in Deep Learning-based generative models, it has not taken long to take advantage of their remarkable performance in the area of time series. Deep neural networks used to work with time series heavily depend on the size and consistency of the datasets used in training. These features are not usually abundant in the real world, where they are usually limited and often have constraints that must be guaranteed. Therefore, an effective way to increase the amount of data is by using Data Augmentation techniques, either by adding noise or permutations and by generating new synthetic data. This work systematically reviews the current state-of-the-art in the area to provide an overview of all available algorithms and proposes a taxonomy of the most relevant research. The efficiency of the different variants will be evaluated as a central part of the process, as well as the different metrics to evaluate the performance and the main problems concerning each model will be analysed. The ultimate aim of this study is to provide a summary of the evolution and performance of areas that produce better results to guide future researchers in this field.

arxiv情報

著者 Guillermo Iglesias,Edgar Talavera,Ángel González-Prieto,Alberto Mozo,Sandra Gómez-Canaval
発行日 2023-03-28 11:27:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.2.6 パーマリンク