MADRL-Based Rate Adaptation for 360$\degree$ Video Streaming with Multi-Viewpoint Prediction

要約

過去数年間で、ネットワーク上の 360$\degree$ ビデオ トラフィックが大幅に増加しました。
360$\degree$ ビデオ再生の主な課題は、限られたネットワーク帯域幅で高品質のエクスペリエンス (QoE) を確保することです。
現在、ほとんどの研究は、帯域幅の消費を削減するために、単一のビューポート予測に基づくタイルベースのアダプティブ ビットレート (ABR) ストリーミングに焦点を当てています。
ただし、単一視点予測のモデルのパフォーマンスは、頭部の動きに固有の不確実性によって大幅に制限され、ユーザーの突然の動きにうまく対処できません。
この論文ではまず、歴史的軌跡を与えられた確率で複数の視点軌跡を生成するためのマルチモーダル時空間注意変換器を紹介します。
提案された方法は、分類問題として視点予測をモデル化し、多視点予測のために入力ビデオ フレームと視点軌跡の空間的および時間的特性を捕捉するためにアテンション メカニズムを使用します。
その後、さまざまなネットワーク条件下でさまざまな QoE 目標を最大化するために、360$\degree$ ビデオ ストリーミングの多視点予測を利用したマルチエージェント深層強化学習 (MADRL) ベースの ABR アルゴリズムが提案されています。
我々は、ABR 問題を分散型部分観察マルコフ決定プロセス (Dec-POMDP) 問題として定式化し、この問題を解決するための集中トレーニングおよび分散実行 (CTDE) フレームワークに基づく MAPPO アルゴリズムを提示します。
実験結果は、私たちが提案した方法が、既存の ABR 方法と比較して、定義された QoE メトリックを最大 85.5% 改善することを示しています。

要約(オリジナル)

Over the last few years, 360$\degree$ video traffic on the network has grown significantly. A key challenge of 360$\degree$ video playback is ensuring a high quality of experience (QoE) with limited network bandwidth. Currently, most studies focus on tile-based adaptive bitrate (ABR) streaming based on single viewport prediction to reduce bandwidth consumption. However, the performance of models for single-viewpoint prediction is severely limited by the inherent uncertainty in head movement, which can not cope with the sudden movement of users very well. This paper first presents a multimodal spatial-temporal attention transformer to generate multiple viewpoint trajectories with their probabilities given a historical trajectory. The proposed method models viewpoint prediction as a classification problem and uses attention mechanisms to capture the spatial and temporal characteristics of input video frames and viewpoint trajectories for multi-viewpoint prediction. After that, a multi-agent deep reinforcement learning (MADRL)-based ABR algorithm utilizing multi-viewpoint prediction for 360$\degree$ video streaming is proposed for maximizing different QoE objectives under various network conditions. We formulate the ABR problem as a decentralized partially observable Markov decision process (Dec-POMDP) problem and present a MAPPO algorithm based on centralized training and decentralized execution (CTDE) framework to solve the problem. The experimental results show that our proposed method improves the defined QoE metric by up to 85.5\% compared to existing ABR methods.

arxiv情報

著者 Haopeng Wang,Zijian Long,Haiwei Dong,Abdulmotaleb El Saddik
発行日 2024-05-13 13:59:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MM, cs.NI, eess.IV パーマリンク