Multiscale Latent-Guided Entropy Model for LiDAR Point Cloud Compression

要約

LiDAR ポイント クラウド (LPC) の不均一な分布と非常にまばらな性質は、その高効率の圧縮に大きな課題をもたらします。
この論文では、元の LPC を octree 構造にエンコードし、octree エントロピー モデルを層ごとに階層的に分解する、新しいエンド ツー エンドの完全に因数分解されたディープ フレームワークを提案します。
提案されたフレームワークは、兄弟と祖先の依存関係をカプセル化するためのサイド情報として階層的な潜在変数を利用します。これにより、点群分布のモデリングに十分なコンテキスト情報が提供され、同じレイヤーでオクツリー ノードの並列エンコードとデコードが可能になります。
さらに、潜在変数の圧縮のための残差コーディング フレームワークを提案します。これは、プログレッシブ ダウンサンプリングによって各レイヤーの空間相関を調査し、対応する残差を完全に因数分解されたエントロピー モデルでモデル化します。
さらに、ネットワークの柔軟性を向上させるために、残差符号化のソフト加算とソフト減算を提案します。
LiDAR ベンチマーク SemanticKITTI と MPEG 指定のデータセット Ford に関する包括的な実験結果は、提案されたフレームワークが以前のすべての LPC フレームワークの中で最先端のパフォーマンスを達成することを示しています。
さらに、エンドツーエンドの完全に因数分解されたフレームワークは、高度に並列化され、時間効率が高く、LPC 圧縮に関する以前の最先端の方法と比較して、デコード時間を 99.8% 以上節約できることが実験によって証明されています。

要約(オリジナル)

The non-uniform distribution and extremely sparse nature of the LiDAR point cloud (LPC) bring significant challenges to its high-efficient compression. This paper proposes a novel end-to-end, fully-factorized deep framework that encodes the original LPC into an octree structure and hierarchically decomposes the octree entropy model in layers. The proposed framework utilizes a hierarchical latent variable as side information to encapsulate the sibling and ancestor dependence, which provides sufficient context information for the modelling of point cloud distribution while enabling the parallel encoding and decoding of octree nodes in the same layer. Besides, we propose a residual coding framework for the compression of the latent variable, which explores the spatial correlation of each layer by progressive downsampling, and model the corresponding residual with a fully-factorized entropy model. Furthermore, we propose soft addition and subtraction for residual coding to improve network flexibility. The comprehensive experiment results on the LiDAR benchmark SemanticKITTI and MPEG-specified dataset Ford demonstrates that our proposed framework achieves state-of-the-art performance among all the previous LPC frameworks. Besides, our end-to-end, fully-factorized framework is proved by experiment to be high-parallelized and time-efficient and saves more than 99.8% of decoding time compared to previous state-of-the-art methods on LPC compression.

arxiv情報

著者 Tingyu Fan,Linyao Gao,Yiling Xu,Dong Wang,Zhu Li
発行日 2022-09-26 08:36:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク