Optimal Transcoding Resolution Prediction for Efficient Per-Title Bitrate Ladder Estimation

要約

アダプティブ ビデオ ストリーミングでは、異種ネットワークの条件とエンドユーザーの要求を満たすために、効率的なビットレート ラダーの構築が必要です。
タイトルごとに最適化されたエンコーディングでは、通常、多数のエンコーディング パラメーターを調べて、各ビデオのパレート最適操作点を検索します。
最近、研究者らは、エンコード前のオーバーヘッド削減のためにコンテンツに最適化されたビットレート ラダーを予測しようと試みています。
ただし、既存の方法では一般に、パレート フロントでエンコード パラメータを推定しますが、依然として後続のプリエンコードが必要です。
この論文では、効率的なビットレート ラダー構築のために、各プリセット ビットレートでの最適なトランスコーディング解像度を直接予測することを提案します。
時空間的特徴を捕捉し、マルチタスク分類問題としてトランスコーディング解像度を予測するために、Temporal Attentive Gated Recurrent Network を採用しています。
したがって、コンテンツに最適化されたビットレート ラダーが、事前エンコーディングなしで効率的に決定できることを実証します。
私たちの方法は、1.21% というわずかな Bjntegaard デルタ レート損失を伴いながら、グラウンド トゥルースのビットレートと解像度のペアを適切に近似しており、最先端の固定ラダーを大幅に上回っています。

要約(オリジナル)

Adaptive video streaming requires efficient bitrate ladder construction to meet heterogeneous network conditions and end-user demands. Per-title optimized encoding typically traverses numerous encoding parameters to search the Pareto-optimal operating points for each video. Recently, researchers have attempted to predict the content-optimized bitrate ladder for pre-encoding overhead reduction. However, existing methods commonly estimate the encoding parameters on the Pareto front and still require subsequent pre-encodings. In this paper, we propose to directly predict the optimal transcoding resolution at each preset bitrate for efficient bitrate ladder construction. We adopt a Temporal Attentive Gated Recurrent Network to capture spatial-temporal features and predict transcoding resolutions as a multi-task classification problem. We demonstrate that content-optimized bitrate ladders can thus be efficiently determined without any pre-encoding. Our method well approximates the ground-truth bitrate-resolution pairs with a slight Bj{\o}ntegaard Delta rate loss of 1.21% and significantly outperforms the state-of-the-art fixed ladder.

arxiv情報

著者 Jinhai Yang,Mengxi Guo,Shijie Zhao,Junlin Li,Li Zhang
発行日 2024-01-09 08:01:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV パーマリンク