MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services

要約

広範なモノのインターネット (IoT) データの更新は、車両のメタバース サービスの没入にとって重要です。
しかし、不安定でリソースに制約のある車両ネットワークで高品質で持続可能なデータを提供することは依然として大きな課題です。
この問題に対処するために、私たちは、メタバース ユーザー (MU) が車両メタバースの拡張現実 (AR) サービス用に最新のローカル データによってトレーニングされた学習モデルに貢献するよう奨励する、新しい没入型モデル取引フレームワークを提案しました。
連合学習。
MU によって提供されるローカルでトレーニングされた学習モデルの AR サービスへの貢献を包括的に評価するために、学習モデルの鮮度と精度、および学習モデルに使用される生データの量と潜在的価値を考慮して、サービスの没入度を捉える新しい没入指標を設計します。
トレーニング。
メタバース サービス プロバイダー (MSP) と MU の間の取引相互作用を平衡制約付き平衡問題 (EPEC) としてモデル化し、それらのコストと利益のバランスを分析し、バランスをとります。
さらに、動的なネットワーク状態とプライバシーの問題を考慮して、MSP の報酬決定をマルチエージェントのマルコフ決定プロセスとして定式化します。
次に、MU や他の MSP に関するプライベート情報なしで動作する、深層強化学習に基づく完全に分散された動的報酬方法が提示されます。
実験結果は、提案されたフレームワークが、ベンチマーク スキームと比較して、実際の AR 関連車両データセット上の AR サービスにおける物体検出と分類のためのより価値の高いモデルを効果的に提供できることを示しています。

要約(オリジナル)

Updates of extensive Internet of Things (IoT) data are critical to the immersion of vehicular metaverse services. However, providing high-quality and sustainable data in unstable and resource-constrained vehicular networks remains a significant challenge. To address this problem, we put forth a novel immersion-aware model trading framework that incentivizes metaverse users (MUs) to contribute learning models trained by their latest local data for augmented reality (AR) services in the vehicular metaverse, while preserving their privacy through federated learning. To comprehensively evaluate the contribution of locally trained learning models provided by MUs to AR services, we design a new immersion metric that captures service immersion by considering the freshness and accuracy of learning models, as well as the amount and potential value of raw data used for training. We model the trading interactions between metaverse service providers (MSPs) and MUs as an equilibrium problem with equilibrium constraints (EPEC) to analyze and balance their costs and gains. Moreover, considering dynamic network conditions and privacy concerns, we formulate the reward decisions of MSPs as a multi-agent Markov decision process. Then, a fully distributed dynamic reward method based on deep reinforcement learning is presented, which operates without any private information about MUs and other MSPs. Experimental results demonstrate that the proposed framework can effectively provide higher-value models for object detection and classification in AR services on real AR-related vehicle datasets compared to benchmark schemes.

arxiv情報

著者 Hongjia Wu,Hui Zeng,Zehui Xiong,Jiawen Kang,Zhiping Cai,Tse-Tin Chan,Dusit Niyato,Zhu Han
発行日 2024-10-25 16:20:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.GT, cs.LG パーマリンク