Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)

要約

このペーパーでは、組み込みシステム、モバイル デバイス、モノのインターネット (IoT) デバイスなどの制約のあるプラットフォーム上で機械学習アプリケーションを有効にするために必要な Minimum Viable Data (MVD) を特定して選択するためのアプローチであるパレート データ フレームワークを紹介します。
戦略的なデータ削減により、帯域幅、エネルギー、計算、ストレージのコストを大幅に削減しながら、高いパフォーマンスを維持できることを実証します。
このフレームワークは、パフォーマンスを犠牲にすることなく、リソースに制約のある環境全体で効率を最適化するために、Minimum Viable Data (MVD) を特定します。
センサーの過剰プロビジョニングや過剰精度、信号のオーバーサンプリングなど、IoT アプリケーションにおける一般的な非効率な慣行に対処し、最適なセンサーの選択、信号の抽出と送信、データ表現のためのスケーラブルなソリューションを提案します。
実験的方法論は、忠実度が低下したセンサーやネットワークとストレージの制約をシミュレートするために、ダウンサンプリング、量子化、切り捨て後の効果的な音響データの特性評価を実証します。
結果は、サンプル レートを 75\% 削減し、ビット深度とクリップ長を 50\% 削減しても、パフォーマンスを最大 95\% 維持できることを示しています。これは、大幅なコストとリソースの削減につながります。
これらの発見は、制約のあるシステムの設計と開発に影響を与えます。
この論文では、農業、運輸、製造などの IoT アプリケーションやセクター全体で高度な AI テクノロジーを民主化し、アクセスを改善し、データ駆動型の洞察のメリットを倍増させる可能性など、このフレームワークのより広範な影響についても説明しています。

要約(オリジナル)

This paper introduces the Pareto Data Framework, an approach for identifying and selecting the Minimum Viable Data (MVD) required for enabling machine learning applications on constrained platforms such as embedded systems, mobile devices, and Internet of Things (IoT) devices. We demonstrate that strategic data reduction can maintain high performance while significantly reducing bandwidth, energy, computation, and storage costs. The framework identifies Minimum Viable Data (MVD) to optimize efficiency across resource-constrained environments without sacrificing performance. It addresses common inefficient practices in an IoT application such as overprovisioning of sensors and overprecision, and oversampling of signals, proposing scalable solutions for optimal sensor selection, signal extraction and transmission, and data representation. An experimental methodology demonstrates effective acoustic data characterization after downsampling, quantization, and truncation to simulate reduced-fidelity sensors and network and storage constraints; results shows that performance can be maintained up to 95\% with sample rates reduced by 75\% and bit depths and clip length reduced by 50\% which translates into substantial cost and resource reduction. These findings have implications on the design and development of constrained systems. The paper also discusses broader implications of the framework, including the potential to democratize advanced AI technologies across IoT applications and sectors such as agriculture, transportation, and manufacturing to improve access and multiply the benefits of data-driven insights.

arxiv情報

著者 Tashfain Ahmed,Josh Siegel
発行日 2024-09-18 16:31:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS パーマリンク