Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration

要約

最近のビデオ圧縮の進歩により、新しい標準と学習ベースのビデオ コーデックの開発により、コーディング パフォーマンスが大幅に向上しました。
ただし、これらの作品のほとんどは、ある程度のシステム遅延 (MPEG コーデックのランダム アクセス モードなど) を許容するアプリケーション シナリオに焦点を当てており、ライブ配信では必ずしも許容できるわけではありません。
この論文では、低遅延構成に基づいた最先端の従来型ビデオ符号化方式と学習型ビデオ符号化方式の比較研究を実施します。
具体的には、この研究には 2 つの MPEG 標準コーデック (H.266/VVC VTM および JVET ECM)、2 つの AOM コーデック (AV1 libaom および AVM)、および 2 つの最近のニューラル ビデオ コーディング モデル (DCVC-DC および DCVC-FM) が含まれています。
公平で有意義な比較を可能にするために、評価は、YCbCr 4:2:0 色空間の AOM および MPEG の共通テスト条件で定義されたテスト シーケンスに対して実行されました。
評価結果では、JVET ECM コーデックが、テストしたすべてのコーデックの中で最高の全体的なコーディング パフォーマンスを提供し、AOM AVM と比較して 16.1% (PSNR に基づく) 平均 BD レートを節約し、DCVC-FM と比較して 11.0% 節約できることがわかりました。
また、背景の動きが大きいテスト コンテンツでは、学習済みビデオ コーデック DCVC-DC および DCVC-FM でのパフォーマンスに一貫性がないことも観察されました。

要約(オリジナル)

Recent advances in video compression have seen significant coding performance improvements with the development of new standards and learning-based video codecs. However, most of these works focus on application scenarios that allow a certain amount of system delay (e.g., Random Access mode in MPEG codecs), which is not always acceptable for live delivery. This paper conducts a comparative study of state-of-the-art conventional and learned video coding methods based on a low delay configuration. Specifically, this study includes two MPEG standard codecs (H.266/VVC VTM and JVET ECM), two AOM codecs (AV1 libaom and AVM), and two recent neural video coding models (DCVC-DC and DCVC-FM). To allow a fair and meaningful comparison, the evaluation was performed on test sequences defined in the AOM and MPEG common test conditions in the YCbCr 4:2:0 color space. The evaluation results show that the JVET ECM codecs offer the best overall coding performance among all codecs tested, with a 16.1% (based on PSNR) average BD-rate saving over AOM AVM, and 11.0% over DCVC-FM. We also observed inconsistent performance with the learned video codecs, DCVC-DC and DCVC-FM, for test content with large background motions.

arxiv情報

著者 Siyue Teng,Yuxuan Jiang,Ge Gao,Fan Zhang,Thomas Davis,Zoe Liu,David Bull
発行日 2024-08-09 12:55:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM, eess.IV パーマリンク