要約
エッジコンピューティングとAIの収束により、エッジAIが生じます。これにより、ネットワークエッジでのリアルタイムAIアプリケーションとサービスの展開が可能になります。
エッジ-AIの基本的な研究の問題の1つは、エッジ推論の加速です。これは、エンドデバイスからエッジサーバーへの分割された推論タスクの細かいオフロードを活用することにより、低遅延の高精度DNN推論サービスを実現することを目的としています。
ただし、既存の研究では、AIユーザーのパーソナライズされた推論のニーズ(例:推論の精度、待ち時間、タスクの複雑さなど)、エッジ推論サービスを提供するAIサービスプロバイダーの収益インセンティブ、および市場指向の文脈内のマルチストレークホルダーガバナンスの収益インセンティブを体系的に探求する実用的なエッジアイル市場の観点をまだ採用していません。
このギャップを埋めるために、DNNモデルパーティション、エッジ推論価格設定、およびリソース割り当ての多次元最適化問題に取り組むために、収益の最大化のためのオークションベースのエッジ推論価格設定メカニズム(AERIA)を提案します。
オンデマンドDNN推論アクセラレーションのためのマルチエッジデバイスエッジの相乗推論スキームを調査し、AIサービスプロバイダー、AIユーザー、およびエッジインフラストラクチャプロバイダーのオークションダイナミクスを分析します。
ランダム化コンセンサスの推定とコスト共有技術を介した戦略的メカニズムの設計により、Edge-AI市場は、収益の最大化、インセンティブの互換性、en望的なものなど、いくつかの望ましい特性を達成します。
4つの代表的なDNN推論ワークロードに基づいた広範なシミュレーション実験は、私たちのエリアメカニズムが収益の最大化におけるいくつかの最先端のアプローチを大幅に上回ることを示しており、エッジ-AI市場におけるオンデマンドDNN推論に対するエリアの有効性を示しています。
要約(オリジナル)
The convergence of edge computing and AI gives rise to Edge-AI, which enables the deployment of real-time AI applications and services at the network edge. One of the fundamental research issues in Edge-AI is edge inference acceleration, which aims to realize low-latency high-accuracy DNN inference services by leveraging the fine-grained offloading of partitioned inference tasks from end devices to edge servers. However, existing research has yet to adopt a practical Edge-AI market perspective, which would systematically explore the personalized inference needs of AI users (e.g., inference accuracy, latency, and task complexity), the revenue incentives for AI service providers that offer edge inference services, and multi-stakeholder governance within a market-oriented context. To bridge this gap, we propose an Auction-based Edge Inference Pricing Mechanism (AERIA) for revenue maximization to tackle the multi-dimensional optimization problem of DNN model partition, edge inference pricing, and resource allocation. We investigate the multi-exit device-edge synergistic inference scheme for on-demand DNN inference acceleration, and analyse the auction dynamics amongst the AI service providers, AI users and edge infrastructure provider. Owing to the strategic mechanism design via randomized consensus estimate and cost sharing techniques, the Edge-AI market attains several desirable properties, including competitiveness in revenue maximization, incentive compatibility, and envy-freeness, which are crucial to maintain the effectiveness, truthfulness, and fairness of our auction outcomes. The extensive simulation experiments based on four representative DNN inference workloads demonstrate that our AERIA mechanism significantly outperforms several state-of-the-art approaches in revenue maximization, demonstrating the efficacy of AERIA for on-demand DNN inference in the Edge-AI market.
arxiv情報
著者 | Songyuan Li,Jia Hu,Geyong Min,Haojun Huang,Jiwei Huang |
発行日 | 2025-03-06 15:08:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google