Adaptive Stream Processing on Edge Devices through Active Inference

要約

現在の IoT のシナリオでは、一定のストリームで生成されるデータ量が継続的に増加しており、それを処理するための新しいアーキテクチャーおよび論理的ソリューションが必要です。
データ処理をコンピューティング スペクトルのエッジに近づけることで、より適切な負荷分散が保証され、原理的には待ち時間が短縮され、プライバシーが向上します。
ただし、このような構造の管理は、特にアプリケーションの所有者やインフラストラクチャ管理者によって指定された要件 (サービス レベル目標 (SLO) とも呼ばれる) を確保する必要がある場合には複雑です。
機械学習 (ML) ベースの管理ソリューションの提案は数多くあるにもかかわらず、研究者や実務家は、長期的な予測と制御、および正確なトラブルシューティングを保証することに依然として苦労しています。
したがって、私たちは、能動推論 (AIF) に基づく新しい ML パラダイムを提案します。AIF は、脳が長期的な驚きを軽減するために感覚情報を常に予測および評価する方法を説明する神経科学の概念です。
これを異種リアル ストリーム処理ユース ケースで実装して評価します。このユース ケースでは、AIF ベースのエージェントが、複数のデバイスで実行されている 3 つの自動運転サービスの 3 つの SLO の履行を継続的に最適化します。
エージェントは因果関係の知識を使用して、そのアクションが要件の実現にどのように関連しているか、およびどの構成を優先すべきかについて徐々に理解を深めました。
このアプローチにより、エージェントは最適なソリューションに収束するまでに最大 30 回の反復を必要とし、短時間で正確な結果を提供できることがわかりました。
さらに、AIF とその因果構造のおかげで、私たちの方法は意思決定に関する完全な透明性を保証し、結果の解釈とトラブルシューティングを容易にします。

要約(オリジナル)

The current scenario of IoT is witnessing a constant increase on the volume of data, which is generated in constant stream, calling for novel architectural and logical solutions for processing it. Moving the data handling towards the edge of the computing spectrum guarantees better distribution of load and, in principle, lower latency and better privacy. However, managing such a structure is complex, especially when requirements, also referred to Service Level Objectives (SLOs), specified by applications’ owners and infrastructure managers need to be ensured. Despite the rich number of proposals of Machine Learning (ML) based management solutions, researchers and practitioners yet struggle to guarantee long-term prediction and control, and accurate troubleshooting. Therefore, we present a novel ML paradigm based on Active Inference (AIF) — a concept from neuroscience that describes how the brain constantly predicts and evaluates sensory information to decrease long-term surprise. We implement it and evaluate it in a heterogeneous real stream processing use case, where an AIF-based agent continuously optimizes the fulfillment of three SLOs for three autonomous driving services running on multiple devices. The agent used causal knowledge to gradually develop an understanding of how its actions are related to requirements fulfillment, and which configurations to favor. Through this approach, our agent requires up to thirty iterations to converge to the optimal solution, showing the capability of offering accurate results in a short amount of time. Furthermore, thanks to AIF and its causal structures, our method guarantees full transparency on the decision making, making the interpretation of the results and the troubleshooting effortless.

arxiv情報

著者 Boris Sedlak,Victor Casamayor Pujol,Andrea Morichetta,Praveen Kumar Donta,Schahram Dustdar
発行日 2024-09-26 15:12:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG パーマリンク