SudokuSens: Enhancing Deep Learning Robustness for IoT Sensing Applications using a Generative Approach

要約

このペーパーでは、機械学習ベースのモノのインターネット (IoT) アプリケーションでトレーニング データを自動生成するための生成フレームワークである SudokuSens について紹介します。生成される合成データは、実際のセンサー データ収集中には遭遇しない実験構成を模倣します。
このフレームワークは、結果として得られる深層学習モデルの堅牢性を向上させ、データ収集が高価な IoT アプリケーションを対象としています。
この研究は、IoT の時系列データが、観察されたオブジェクトの特徴と、周囲の環境の交絡する固有の特性や経験した動的な環境の擾乱とを絡ませているという事実によって動機付けられています。
したがって、IoT トレーニング データに十分な多様性を組み込むには、考慮されるオブジェクトの数と、そのようなオブジェクトが遭遇する可能性のある環境条件の倍増となるトレーニング ケースの組み合わせ爆発を考慮する必要があります。
私たちのフレームワークは、これらの乗算的なトレーニングのニーズを大幅に軽減します。
オブジェクトのシグネチャを環境条件から切り離すために、条件変分オートエンコーダー (CVAE) を採用しています。これにより、データ収集のニーズを乗法から (ほぼ) 線形に削減できると同時に、欠落している条件 (のデータ) を合成的に生成できます。
動的外乱に対するロバスト性を得るために、セッションを意識した時間対比学習アプローチが採用されます。
前述の 2 つのアプローチを統合することで、SudokuSens は IoT アプリケーションのディープ ラーニングの堅牢性を大幅に向上させます。
私たちは、SudokuSens がさまざまなデータセットの下流の推論タスクにどの程度利益をもたらすかを調査し、このアプローチが特に効果的である条件について議論します。

要約(オリジナル)

This paper introduces SudokuSens, a generative framework for automated generation of training data in machine-learning-based Internet-of-Things (IoT) applications, such that the generated synthetic data mimic experimental configurations not encountered during actual sensor data collection. The framework improves the robustness of resulting deep learning models, and is intended for IoT applications where data collection is expensive. The work is motivated by the fact that IoT time-series data entangle the signatures of observed objects with the confounding intrinsic properties of the surrounding environment and the dynamic environmental disturbances experienced. To incorporate sufficient diversity into the IoT training data, one therefore needs to consider a combinatorial explosion of training cases that are multiplicative in the number of objects considered and the possible environmental conditions in which such objects may be encountered. Our framework substantially reduces these multiplicative training needs. To decouple object signatures from environmental conditions, we employ a Conditional Variational Autoencoder (CVAE) that allows us to reduce data collection needs from multiplicative to (nearly) linear, while synthetically generating (data for) the missing conditions. To obtain robustness with respect to dynamic disturbances, a session-aware temporal contrastive learning approach is taken. Integrating the aforementioned two approaches, SudokuSens significantly improves the robustness of deep learning for IoT applications. We explore the degree to which SudokuSens benefits downstream inference tasks in different data sets and discuss conditions under which the approach is particularly effective.

arxiv情報

著者 Tianshi Wang,Jinyang Li,Ruijie Wang,Denizhan Kara,Shengzhong Liu,Davis Wertheimer,Antoni Viros-i-Martin,Raghu Ganti,Mudhakar Srivatsa,Tarek Abdelzaher
発行日 2024-02-08 18:35:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク