要約
3D占有予測は、環境構造とセマンティクスの包括的な認識を可能にするため、堅牢な自律運転システムにとって重要です。
ほとんどの既存の方法は、密なボクセルベースのシーン表現を採用しており、運転シーンのスパースを無視し、非効率性をもたらします。
最近の作品は、まばらなガウスに基づいたオブジェクト中心の表現を探求していますが、それらの楕円形の形状は、多様な構造のモデリングを以前に制限します。
現実世界の運転シーンでは、オブジェクトは豊富な幾何学(たとえば、立方体、シリンダー、不規則な形状)を示し、正確なモデリングのために密に密集した過度の楕円形ガウス人を必要とし、非効率的な表現につながります。
これに対処するために、幾何学的に表現力豊かなスーパークエードリックをシーンプリミティブとして使用することを提案し、固有の形状の多様性を通じてより少ないプリミティブを持つ複雑な構造の効率的な表現を可能にします。
確率論的なスーパークアドリック混合モデルを開発します。これは、それぞれのスーパークアドリックを、対応するジオメトリの事前で占有確率分布として解釈し、確率的混合物を介してセマンティクスを計算します。
これに基づいて、効率的な3D占有予測のための超四半期ベースのモデルであるQuadricFormerを提示し、占有地域に超平測を集中させることによりモデリング効率をさらに強化するための剪定とスプリットモジュールを導入します。
Nuscenesデータセットでの広範な実験は、Quadricformerが優れた効率を維持しながら最先端のパフォーマンスを達成することを示しています。
要約(オリジナル)
3D occupancy prediction is crucial for robust autonomous driving systems as it enables comprehensive perception of environmental structures and semantics. Most existing methods employ dense voxel-based scene representations, ignoring the sparsity of driving scenes and resulting in inefficiency. Recent works explore object-centric representations based on sparse Gaussians, but their ellipsoidal shape prior limits the modeling of diverse structures. In real-world driving scenes, objects exhibit rich geometries (e.g., cuboids, cylinders, and irregular shapes), necessitating excessive ellipsoidal Gaussians densely packed for accurate modeling, which leads to inefficient representations. To address this, we propose to use geometrically expressive superquadrics as scene primitives, enabling efficient representation of complex structures with fewer primitives through their inherent shape diversity. We develop a probabilistic superquadric mixture model, which interprets each superquadric as an occupancy probability distribution with a corresponding geometry prior, and calculates semantics through probabilistic mixture. Building on this, we present QuadricFormer, a superquadric-based model for efficient 3D occupancy prediction, and introduce a pruning-and-splitting module to further enhance modeling efficiency by concentrating superquadrics in occupied regions. Extensive experiments on the nuScenes dataset demonstrate that QuadricFormer achieves state-of-the-art performance while maintaining superior efficiency.
arxiv情報
著者 | Sicheng Zuo,Wenzhao Zheng,Xiaoyong Han,Longchao Yang,Yong Pan,Jiwen Lu |
発行日 | 2025-06-12 17:59:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google