Self-supervised Activity Representation Learning with Incremental Data: An Empirical Study



– スマートフォン等のモバイル端末の様々なセンサーから継続的に大量のデータが生成される環境で、そのデータを分析することには注目すべき課題がある。例えば、アノテーションされたデータへの制限的なアクセスと、絶え間なく変化し続ける環境がある。
– 自己教師あり学習の最近の進歩は、ラベル付けされたデータセットの不足に対処するために、従来の教師ありモデルの性能を向上させる事前学習ステップとして使用されている。この研究では、データが徐々に利用可能になる時間系列分類のタスクに対して自己教師あり表現学習モデルを使用することの影響を検討する。
– 我々は、未ラベルの時間系列データのコーパスを使用して情報を抽出するモデルを学習し、モデルによって抽出された特徴量を使用してラベルつきデータで分類を行うワークフローを提案し、評価した。私たちは、さまざまな種類のセンサーを使用したさまざまなアプリケーションにおける4つの公共データセットを横断的に分析し、未ラベルデータのサイズ、分布、ソースの変化が最終的な分類パフォーマンスに与える影響を分析した。


In the context of mobile sensing environments, various sensors on mobile devices continually generate a vast amount of data. Analyzing this ever-increasing data presents several challenges, including limited access to annotated data and a constantly changing environment. Recent advancements in self-supervised learning have been utilized as a pre-training step to enhance the performance of conventional supervised models to address the absence of labelled datasets. This research examines the impact of using a self-supervised representation learning model for time series classification tasks in which data is incrementally available. We proposed and evaluated a workflow in which a model learns to extract informative features using a corpus of unlabeled time series data and then conducts classification on labelled data using features extracted by the model. We analyzed the effect of varying the size, distribution, and source of the unlabeled data on the final classification performance across four public datasets, including various types of sensors in diverse applications.


著者 Jason Liu,Shohreh Deldari,Hao Xue,Van Nguyen,Flora D. Salim
発行日 2023-05-01 01:39:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.LG, eess.SP パーマリンク