Representation Learning for Wearable-Based Applications in the Case of Missing Data

要約

ウェアラブル デバイスはセンサー データを継続的に収集し、それを使用して睡眠、身体活動、感情などの個人の行動を推測します。
この分野における大きな関心と進歩にもかかわらず、現実世界の環境でマルチモーダル センサー データをモデル化することは、データ品質が低く、データ アノテーションが限られているため、依然として困難です。
この研究では、欠落しているウェアラブル データを代入するための表現学習を調査し、それを最先端の統計的アプローチと比較します。
異なるマスキング率を使用して、10 個の生理学的信号および行動信号に対するトランスフォーマー モデルのパフォーマンスを調査します。
私たちの結果は、より頻繁に変化する信号の欠損データ代入では、変換器がベースラインを上回るパフォーマンスを発揮しますが、単調信号ではそうではないことを示しています。
さらに、代入戦略とマスキング比率が下流の分類タスクに及ぼす影響を調査します。
私たちの研究は、マスキングベースの自己教師あり学習タスクの設計と開発に関する洞察を提供し、ウェアラブルデバイスのデータ欠落という課題に対処するためにハイブリッドベースの代入戦略の採用を提唱しています。

要約(オリジナル)

Wearable devices continuously collect sensor data and use it to infer an individual’s behavior, such as sleep, physical activity, and emotions. Despite the significant interest and advancements in this field, modeling multimodal sensor data in real-world environments is still challenging due to low data quality and limited data annotations. In this work, we investigate representation learning for imputing missing wearable data and compare it with state-of-the-art statistical approaches. We investigate the performance of the transformer model on 10 physiological and behavioral signals with different masking ratios. Our results show that transformers outperform baselines for missing data imputation of signals that change more frequently, but not for monotonic signals. We further investigate the impact of imputation strategies and masking rations on downstream classification tasks. Our study provides insights for the design and development of masking-based self-supervised learning tasks and advocates the adoption of hybrid-based imputation strategies to address the challenge of missing data in wearable devices.

arxiv情報

著者 Janosch Jungo,Yutong Xiang,Shkurta Gashi,Christian Holz
発行日 2024-01-12 11:14:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.SP パーマリンク