要約
3D ガウス スプラッティング (GS) は、新しいビュー合成において優れたレンダリング品質と生成速度を実証します。
ただし、データ サイズが大きいため、保存と送信に課題が生じ、3D GS 圧縮が不可欠なテクノロジとなっています。
現在の 3D GS 圧縮の研究は、明示的な 3D GS データを暗黙的な形式に変換するなど、よりコンパクトなシーン表現の開発に主に焦点を当てています。
対照的に、GS データ自体の圧縮についてはほとんど検討されていません。
このギャップに対処するために、階層 GS 圧縮 (HGSC) 技術を提案します。
最初に、グローバル重要性とローカル重要性の両方から導出された重要度スコアに基づいて重要でないガウスを削除し、視覚的な品質を維持しながら冗長性を効果的に削減します。
Octree 構造は 3D 位置の圧縮に使用されます。
3D GS オクツリーに基づいて、KD ツリーを使用して 3D GS を複数のブロックに分割することにより、階層的な属性圧縮戦略を実装します。
最遠点サンプリングを適用して、各ブロック内のアンカー プリミティブを選択し、その他のプリミティブをさまざまな詳細レベル (LoD) の非アンカー プリミティブとして選択します。
アンカー プリミティブは、空間的な冗長性を削減するために、さまざまな LoD にわたる非アンカー プリミティブを予測するための参照点として機能します。
アンカー プリミティブの場合、領域適応型階層変換を使用して、さまざまな属性のほぼ可逆圧縮を実現します。
非アンカー プリミティブの場合、それぞれは k に最近接したアンカー プリミティブに基づいて予測されます。
予測誤差をさらに最小限に抑えるために、再構成された LoD とアンカー プリミティブが結合されて、次の LoD を予測するための新しいアンカー プリミティブが形成されます。
私たちの方法は、特に、小規模なシーン データセットに対する最先端の圧縮方法と比較して、優れた圧縮品質と 4.5 倍を超える大幅なデータ サイズ削減を実現します。
要約(オリジナル)
3D Gaussian Splatting (GS) demonstrates excellent rendering quality and generation speed in novel view synthesis. However, substantial data size poses challenges for storage and transmission, making 3D GS compression an essential technology. Current 3D GS compression research primarily focuses on developing more compact scene representations, such as converting explicit 3D GS data into implicit forms. In contrast, compression of the GS data itself has hardly been explored. To address this gap, we propose a Hierarchical GS Compression (HGSC) technique. Initially, we prune unimportant Gaussians based on importance scores derived from both global and local significance, effectively reducing redundancy while maintaining visual quality. An Octree structure is used to compress 3D positions. Based on the 3D GS Octree, we implement a hierarchical attribute compression strategy by employing a KD-tree to partition the 3D GS into multiple blocks. We apply farthest point sampling to select anchor primitives within each block and others as non-anchor primitives with varying Levels of Details (LoDs). Anchor primitives serve as reference points for predicting non-anchor primitives across different LoDs to reduce spatial redundancy. For anchor primitives, we use the region adaptive hierarchical transform to achieve near-lossless compression of various attributes. For non-anchor primitives, each is predicted based on the k-nearest anchor primitives. To further minimize prediction errors, the reconstructed LoD and anchor primitives are combined to form new anchor primitives to predict the next LoD. Our method notably achieves superior compression quality and a significant data size reduction of over 4.5 times compared to the state-of-the-art compression method on small scenes datasets.
arxiv情報
著者 | He Huang,Wenjie Huang,Qi Yang,Yiling Xu,Zhu li |
発行日 | 2024-11-11 13:34:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google