Embarrassingly Simple MixUp for Time-series

要約

タイトル:Embarrassingly Simple MixUp for Time-series
要約:
– 時系列データにラベル付けすることはコストが高く、データの動的性質を考えると難しいタスクであるため、しばしば限られたラベル付きデータの状況に直面することがある。
– コンピュータビジョンのような領域では、既存のラベル付きデータの使用を活用するためにデータ拡張テクニックが成功裏に使用されてきた。
– 我々は、MixUpと呼ばれる最も一般的に使用されている技術の1つを、時系列領域に適応している。
– 当社の提案、MixUp++とLatentMixUp++は、生の時系列データと分類モデルの潜在空間での補間を行うための単純な修正を使用している。
– 私たちはまた、半教師あり学習を使用して未ラベルデータを活用するためにこれらの方法を拡張している。
– 私たちは、LatentMixUp++を使用することで、低ラベルデータ、高ラベルデータ両方の公開データセットにおいて、時系列分類に1%〜15%の大幅な改善を観察した。

要約(オリジナル)

Labeling time series data is an expensive task because of domain expertise and dynamic nature of the data. Hence, we often have to deal with limited labeled data settings. Data augmentation techniques have been successfully deployed in domains like computer vision to exploit the use of existing labeled data. We adapt one of the most commonly used technique called MixUp, in the time series domain. Our proposed, MixUp++ and LatentMixUp++, use simple modifications to perform interpolation in raw time series and classification model’s latent space, respectively. We also extend these methods with semi-supervised learning to exploit unlabeled data. We observe significant improvements of 1\% – 15\% on time series classification on two public datasets, for both low labeled data as well as high labeled data regimes, with LatentMixUp++.

arxiv情報

著者 Karan Aggarwal,Jaideep Srivastava
発行日 2023-04-09 16:34:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク