要約
最近、極座標ベースの表現が 3D 知覚タスクに有望であることが示されています。
デカルト法と比較して、極グリッドは実行可能な代替手段を提供し、より広い領域をカバーしながら、近くの空間の詳細をより良く保存します。
しかし、不均一な分割による特徴の歪みに直面しています。
これらの問題に対処するために、極座標で動作する新しい 3D マルチモーダル予測器である極ボクセル占有予測器 (PVP) を導入します。
PVP は、歪みを克服するための 2 つの主要な設計要素を備えています。1 つはグローバル空間データを 3D ボリュームに統合する Global Represent Propagation (GRP) モジュール、もう 1 つは 3D 歪みを 2D 畳み込みに単純化する Plane Decomposition Convolution (PD-Conv) モジュールです。
これらの革新により、PVP は既存の手法を上回るパフォーマンスを実現し、OpenOccupancy データセットの mIoU と IoU メトリクスの大幅な改善を実現します。
要約(オリジナル)
Recently, polar coordinate-based representations have shown promise for 3D perceptual tasks. Compared to Cartesian methods, polar grids provide a viable alternative, offering better detail preservation in nearby spaces while covering larger areas. However, they face feature distortion due to non-uniform division. To address these issues, we introduce the Polar Voxel Occupancy Predictor (PVP), a novel 3D multi-modal predictor that operates in polar coordinates. PVP features two key design elements to overcome distortion: a Global Represent Propagation (GRP) module that integrates global spatial data into 3D volumes, and a Plane Decomposed Convolution (PD-Conv) that simplifies 3D distortions into 2D convolutions. These innovations enable PVP to outperform existing methods, achieving significant improvements in mIoU and IoU metrics on the OpenOccupancy dataset.
arxiv情報
著者 | Yujing Xue,Jiaxiang Liu,Jiawei Du,Joey Tianyi Zhou |
発行日 | 2024-12-10 15:54:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google