要約
従来の機械学習手法では、トレーニング フェーズとテスト フェーズの間でデータの分布が変化すると、不正確な予測が生成される傾向があります。
この脆弱性は、特にモバイル ヘルスケアなどのアプリケーションにおいて深刻な結果を引き起こす可能性があります。
不確実性の推定では、モデルの出力の信頼性を評価することで、この問題を軽減できる可能性があります。
ただし、既存の不確実性推定手法は多くの場合、大量の計算リソースとメモリを必要とするため、マイクロコントローラー (MCU) での実装は非現実的です。
この制限により、心臓発作の検出など、多くの重要なオンデバイス ウェアラブル イベント検出 (WED) アプリケーションの実現が妨げられます。
このペーパーでは、MCU 向けの新しい不確実性およびリソース認識イベント検出フレームワークである UR2M について紹介します。
具体的には、(i) 正確なイベント検出と信頼性の高い不確実性推定のための証拠理論に基づいて、不確実性を認識した WED を開発します。
(ii) カスケード ML フレームワークを導入して、異なるイベント モデル間で浅いモデル層を共有することにより、早期終了による効率的なモデル推論を実現します。
(iii) システム効率を高めるためにモデルと MCU ライブラリの展開を最適化します。
私たちは広範な実験を実施し、3 つのウェアラブル データセットを使用して UR2M を従来の不確実性ベースラインと比較しました。
私たちの結果は、UR2M が 2 つの人気のある MCU で最大 864% 高速な推論速度、857% の不確実性推定のエネルギー節約、55% のメモリ節約、そして不確実性定量化パフォーマンスの 22% 向上を達成することを示しています。
UR2M は幅広い MCU に導入でき、リアルタイムで信頼性の高い WED アプリケーションを大幅に拡張します。
要約(オリジナル)
Traditional machine learning techniques are prone to generating inaccurate predictions when confronted with shifts in the distribution of data between the training and testing phases. This vulnerability can lead to severe consequences, especially in applications such as mobile healthcare. Uncertainty estimation has the potential to mitigate this issue by assessing the reliability of a model’s output. However, existing uncertainty estimation techniques often require substantial computational resources and memory, making them impractical for implementation on microcontrollers (MCUs). This limitation hinders the feasibility of many important on-device wearable event detection (WED) applications, such as heart attack detection. In this paper, we present UR2M, a novel Uncertainty and Resource-aware event detection framework for MCUs. Specifically, we (i) develop an uncertainty-aware WED based on evidential theory for accurate event detection and reliable uncertainty estimation; (ii) introduce a cascade ML framework to achieve efficient model inference via early exits, by sharing shallower model layers among different event models; (iii) optimize the deployment of the model and MCU library for system efficiency. We conducted extensive experiments and compared UR2M to traditional uncertainty baselines using three wearable datasets. Our results demonstrate that UR2M achieves up to 864% faster inference speed, 857% energy-saving for uncertainty estimation, 55% memory saving on two popular MCUs, and a 22% improvement in uncertainty quantification performance. UR2M can be deployed on a wide range of MCUs, significantly expanding real-time and reliable WED applications.
arxiv情報
著者 | Hong Jia,Young D. Kwon,Dong Ma,Nhat Pham,Lorena Qendro,Tam Vu,Cecilia Mascolo |
発行日 | 2024-02-14 15:51:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google