NUC-Net: Non-uniform Cylindrical Partition Network for Efficient LiDAR Semantic Segmentation

要約

LIDARセマンティックセグメンテーションは、自律運転において重要な役割を果たします。
LIDARセマンティックセグメンテーション用の既存のボクセルベースの方法は、3D LIDARポイントクラウドに均一なパーティションを適用して、デカルト/円筒座標に基づいて構造化された表現を形成します。
これらの方法は印象的なパフォーマンスを示していますが、既存のボクセルベースの方法の欠点は2つの側面に残ります。(1)十分な量のボクセル解像度が必要であり、大量の計算コストとメモリ消費をもたらします。
(2)Lidar Point Cloudの不均衡な点分布をうまく処理しません。
この論文では、上記の課題に取り組むために、Nuc-Netという名前の不均一な円筒形のパーティションネットワークを提案します。
具体的には、放射状軸を不均一に分割し、代表的で効率的なボクセル表現を生成するための間隔(API)メソッドの算術進行を提案します。
さらに、コンテキスト情報を改善するために、不均一なマルチスケール集約方法を提案します。
私たちの方法は、SemantickittiおよびNuscenesデータセットの最先端のパフォーマンスを、はるかに速い速度とトレーニング時間をはるかに短くします。
また、私たちの方法は、Lidarセマンティックセグメンテーションの一般的なコンポーネントになる可能性があります。これにより、均一なカウンターパートの精度と効率の両方が$ 4 \ Times $トレーニングのより速く、$ 2 \ Times $ GPUメモリ削減と$ 3 \ Times $ Inference Speepupの両方を大幅に向上させます。
さらに、NUCが効果的である理由と、ポイント分布がパフォーマンスにどのように影響するかを理解するための理論的分析を提供します。
コードは\ href {https://github.com/alanwxz/nuc-net} {https://github.com/alanwxz/nuc-net}で入手できます。

要約(オリジナル)

LiDAR semantic segmentation plays a vital role in autonomous driving. Existing voxel-based methods for LiDAR semantic segmentation apply uniform partition to the 3D LiDAR point cloud to form a structured representation based on cartesian/cylindrical coordinates. Although these methods show impressive performance, the drawback of existing voxel-based methods remains in two aspects: (1) it requires a large enough input voxel resolution, which brings a large amount of computation cost and memory consumption. (2) it does not well handle the unbalanced point distribution of LiDAR point cloud. In this paper, we propose a non-uniform cylindrical partition network named NUC-Net to tackle the above challenges. Specifically, we propose the Arithmetic Progression of Interval (API) method to non-uniformly partition the radial axis and generate the voxel representation which is representative and efficient. Moreover, we propose a non-uniform multi-scale aggregation method to improve contextual information. Our method achieves state-of-the-art performance on SemanticKITTI and nuScenes datasets with much faster speed and much less training time. And our method can be a general component for LiDAR semantic segmentation, which significantly improves both the accuracy and efficiency of the uniform counterpart by $4 \times$ training faster and $2 \times$ GPU memory reduction and $3 \times$ inference speedup. We further provide theoretical analysis towards understanding why NUC is effective and how point distribution affects performance. Code is available at \href{https://github.com/alanWXZ/NUC-Net}{https://github.com/alanWXZ/NUC-Net}.

arxiv情報

著者 Xuzhi Wang,Wei Feng,Lingdong Kong,Liang Wan
発行日 2025-06-02 02:51:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク