要約
スケーラブルなヒューマン マシン コーディングの基本前提は、基本層が自動マシン分析を目的としており、したがって同じコンテンツを人間が見る場合よりも圧縮しやすいということです。
このようなコーディングの使用例には、ビデオ監視や交通監視などがありますが、これらのコンテンツの大部分は人間には決して見られません。
したがって、システムは最も頻繁にベース レイヤ レートで動作するため、ベース レイヤの効率が最も重要になります。
この論文では、最先端のスケーラブルなマンマシン画像コーデックにおけるベース層の符号化効率を分析し、それが改善できることを示します。
特に、オブジェクト検出とインスタンスのセグメンテーションに関する現在の最良の結果と比較して、BD レートで 20 ~ 40% の向上が可能であることを実証します。
要約(オリジナル)
A basic premise in scalable human-machine coding is that the base layer is intended for automated machine analysis and is therefore more compressible than the same content would be for human viewing. Use cases for such coding include video surveillance and traffic monitoring, where the majority of the content will never be seen by humans. Therefore, base layer efficiency is of paramount importance because the system would most frequently operate at the base-layer rate. In this paper, we analyze the coding efficiency of the base layer in a state-of-the-art scalable human-machine image codec, and show that it can be improved. In particular, we demonstrate that gains of 20-40% in BD-Rate compared to the currently best results on object detection and instance segmentation are possible.
arxiv情報
著者 | Yalda Foroutan,Alon Harell,Anderson de Andrade,Ivan V. Bajić |
発行日 | 2023-07-05 16:52:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google