Efficient IoT Inference via Context-Awareness

要約

低電力プラットフォーム上で深層学習ベースの分類モデルを最適化するための既存の戦略は、対象となるすべてのクラスでモデルがトレーニングされることを前提としていますが、この論文では、コンテキスト認識を採用する、つまり現在のコンテキスト内で可能性の高いクラスのみに焦点を当てることで、分類モデルの性能を大幅に向上できると主張しています。
リソースに制約のある環境でのパフォーマンス。
私たちは、スケーラブルで効率的なコンテキスト認識分類のための新しいパラダイム CACTUS を提案します。このパラダイムでは、マイクロ分類子が現在のコンテキストに関連する小さなクラスのセットを認識し、コンテキストの変更が発生すると、別の適切なマイクロ分類子に迅速に切り替わります。
CACTUS には、コンテキスト認識型分類器のトレーニング コストの最適化、分類器間のオンザフライのコンテキスト認識型切り替えの有効化、限られたリソースで最適なコンテキスト認識型分類器の選択など、いくつかの革新機能があります。
CACTUS が、さまざまなデータセットと IoT プラットフォームにわたって、精度、レイテンシ、コンピューティング バジェットにおいて大きなメリットを達成していることを示します。

要約(オリジナル)

While existing strategies for optimizing deep learning-based classification models on low-power platforms assume the models are trained on all classes of interest, this paper posits that adopting context-awareness i.e. focusing solely on the likely classes in the current context, can substantially enhance performance in resource-constrained environments. We propose a new paradigm, CACTUS, for scalable and efficient context-aware classification where a micro-classifier recognizes a small set of classes relevant to the current context and, when context change happens, rapidly switches to another suitable micro-classifier. CACTUS has several innovations including optimizing the training cost of context-aware classifiers, enabling on-the-fly context-aware switching between classifiers, and selecting the best context-aware classifiers given limited resources. We show that CACTUS achieves significant benefits in accuracy, latency, and compute budget across a range of datasets and IoT platforms.

arxiv情報

著者 Mohammad Mehdi Rastikerdar,Jin Huang,Shiwei Fang,Hui Guan,Deepak Ganesan
発行日 2023-10-29 18:57:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク