PVP: Polar Representation Boost for 3D Semantic Occupancy Prediction

要約

最近、極座標ベースの表現が 3D 知覚タスクに有望であることが示されています。
デカルト法と比較して、極グリッドは実行可能な代替手段を提供し、より広い領域をカバーしながら、近くの空間の詳細をより良く保存します。
しかし、不均一な分割による特徴の歪みに直面しています。
これらの問題に対処するために、極座標で動作する新しい 3D マルチモーダル予測器である極ボクセル占有予測器 (PVP) を導入します。
PVP は、歪みを克服するための 2 つの主要な設計要素を備えています。1 つはグローバル空間データを 3D ボリュームに統合する Global Represent Propagation (GRP) モジュール、もう 1 つは 3D 歪みを 2D 畳み込みに単純化する Plane Decomposition Convolution (PD-Conv) モジュールです。
これらの革新により、PVP は既存の手法を上回るパフォーマンスを実現し、OpenOccupancy データセットの mIoU と IoU メトリクスの大幅な改善を実現します。

要約(オリジナル)

Recently, polar coordinate-based representations have shown promise for 3D perceptual tasks. Compared to Cartesian methods, polar grids provide a viable alternative, offering better detail preservation in nearby spaces while covering larger areas. However, they face feature distortion due to non-uniform division. To address these issues, we introduce the Polar Voxel Occupancy Predictor (PVP), a novel 3D multi-modal predictor that operates in polar coordinates. PVP features two key design elements to overcome distortion: a Global Represent Propagation (GRP) module that integrates global spatial data into 3D volumes, and a Plane Decomposed Convolution (PD-Conv) that simplifies 3D distortions into 2D convolutions. These innovations enable PVP to outperform existing methods, achieving significant improvements in mIoU and IoU metrics on the OpenOccupancy dataset.

arxiv情報

著者 Yujing Xue,Jiaxiang Liu,Jiawei Du,Joey Tianyi Zhou
発行日 2024-12-10 15:54:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク