A Neural-network Enhanced Video Coding Framework beyond ECM

要約

この論文では、従来のコーディング手法の範囲を超えて拡張される深層学習ベースのアプローチの実証的なショーケースとして機能する、ハイブリッド ビデオ圧縮フレームワークを提案します。
提案されたハイブリッド フレームワークは、Versatile Videocoding (VVC) 標準をさらに拡張した拡張圧縮モデル (ECM) に基づいています。
最新の ECM リファレンス ソフトウェアを、ブロック分割、深層学習ベースのループ フィルター、ECM 内に統合されていたものの以前は非アクティブであったブロック重要度マッピング (BIM) のアクティブ化など、適切に設計されたコーディング技術で強化し、コーディング パフォーマンスをさらに強化しました。
ECM-10.0 と比較して、私たちの方法は、ランダム アクセス (RA) 構成の下で、Y、U、および V コンポーネントに対してそれぞれ 6.26、13.33、および 12.33 の BD レートの節約を達成します。

要約(オリジナル)

In this paper, a hybrid video compression framework is proposed that serves as a demonstrative showcase of deep learning-based approaches extending beyond the confines of traditional coding methodologies. The proposed hybrid framework is founded upon the Enhanced Compression Model (ECM), which is a further enhancement of the Versatile Video Coding (VVC) standard. We have augmented the latest ECM reference software with well-designed coding techniques, including block partitioning, deep learning-based loop filter, and the activation of block importance mapping (BIM) which was integrated but previously inactive within ECM, further enhancing coding performance. Compared with ECM-10.0, our method achieves 6.26, 13.33, and 12.33 BD-rate savings for the Y, U, and V components under random access (RA) configuration, respectively.

arxiv情報

著者 Yanchen Zhao,Wenxuan He,Chuanmin Jia,Qizhe Wang,Junru Li,Yue Li,Chaoyi Lin,Kai Zhang,Li Zhang,Siwei Ma
発行日 2024-02-13 11:56:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク