要約
多用途のビデオコーディング(VVC)の新しい手法の中で、ネストされたマルチタイプツリー(QT+MTT)ブロック構造を備えたクアッドツリーは、より柔軟なブロックパーティションパターンを提供することにより、かなりのコーディングゲインをもたらします。
ただし、VVCエンコーダーの再帰パーティション検索により、エンコーダーの複雑さが大幅に向上します。
この問題に対処するために、パーティションマップベースのアルゴリズムを提案して、インターコードで高速ブロックパーティションを追求します。
コーディング内のパーティションマップベースの方法に関する以前の作業に基づいて、VVCインターコードの特性を分析し、早期終了のためにMTTマスクを組み込むことでパーティションマップを改善します。
次に、空間的特徴と時間的機能の両方を使用してパーティションマップを予測するニューラルネットワークを開発します。
積み重ねられたトップダウンおよびボトムアップ処理、量子化パラメーター変調層、パーティション化適応ワーピングなど、いくつかの特別なデザインで構成されています。
さらに、複雑さの削減とレート延長(RD)パフォーマンスの損失との間に微調整されたトレードオフを達成するために、二重の授業決定スキームを提示します。
実験結果は、提案された方法が、ランダムアクセス構成の下で2.12%のBjontegaard Deltaビットレート(BDBR)で平均51.30%のエンコード時間を達成することを示しています。
要約(オリジナル)
Among the new techniques of Versatile Video Coding (VVC), the quadtree with nested multi-type tree (QT+MTT) block structure yields significant coding gains by providing more flexible block partitioning patterns. However, the recursive partition search in the VVC encoder increases the encoder complexity substantially. To address this issue, we propose a partition map-based algorithm to pursue fast block partitioning in inter coding. Based on our previous work on partition map-based methods for intra coding, we analyze the characteristics of VVC inter coding, and thus improve the partition map by incorporating an MTT mask for early termination. Next, we develop a neural network that uses both spatial and temporal features to predict the partition map. It consists of several special designs including stacked top-down and bottom-up processing, quantization parameter modulation layers, and partitioning-adaptive warping. Furthermore, we present a dual-threshold decision scheme to achieve a fine-grained trade-off between complexity reduction and rate-distortion (RD) performance loss. The experimental results demonstrate that the proposed method achieves an average 51.30% encoding time saving with a 2.12% Bjontegaard Delta Bit Rate (BDBR) under the random access configuration.
arxiv情報
著者 | Xinmin Feng,Zhuoyuan Li,Li Li,Dong Liu,Feng Wu |
発行日 | 2025-04-25 14:53:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google