要約
点群セグメンテーション (PCS) は、ロボットの認識およびナビゲーション タスクにおいて重要な役割を果たします。
大規模な屋外点群を効率的に理解するために、距離画像表現が一般的に採用されています。
この画像のような表現はコンパクトで構造化されているため、距離画像ベースの PCS モデルが実用的になります。
ただし、距離画像内の望ましくない欠損値は、オブジェクトの形状やパターンにダメージを与えます。
この問題により、モデルがオブジェクトから一貫した完全な幾何学的情報を学習することが困難になります。
その結果、PCS モデルは劣ったパフォーマンスしか得られません。
この問題を深く掘り下げると、不合理な投影アプローチとスキャンのデスキューの使用が主に距離画像に望ましくない欠損値を引き起こすことがわかります。
さらに、これまでのほとんどすべての研究では、PCS タスクの予期しない欠損値を埋めることを考慮していませんでした。
この問題を軽減するために、我々はまず、生成された距離画像における大量の欠損値を回避するための新しい投影法、すなわちスキャン展開++ (SU++) を提案します。
次に、欠損値をさらに埋めるために、単純だが効果的なアプローチ、つまり範囲依存の $K$ 最近傍補間 ($K$NNI) を導入します。
最後に、欠損値補充ネットワーク (FMVNet) と高速 FMVNet を紹介します。
SemanticKITTI、SemanticPOSS、nuScenes データセットに関する広範な実験結果は、提案された SU++ と $K$NNI を採用することにより、既存の距離画像ベースの PCS モデルがベースライン モデルよりも一貫して優れたパフォーマンスを達成することを示しています。
さらに、FMVNet と Fast FMVNet はどちらも、速度と精度のトレードオフの点で最先端のパフォーマンスを実現します。
提案された方法は、他の距離画像ベースのタスクや実際のアプリケーションに適用できます。
要約(オリジナル)
Point cloud segmentation (PCS) plays an essential role in robot perception and navigation tasks. To efficiently understand large-scale outdoor point clouds, their range image representation is commonly adopted. This image-like representation is compact and structured, making range image-based PCS models practical. However, undesirable missing values in the range images damage the shapes and patterns of objects. This problem creates difficulty for the models in learning coherent and complete geometric information from the objects. Consequently, the PCS models only achieve inferior performance. Delving deeply into this issue, we find that the use of unreasonable projection approaches and deskewing scans mainly leads to unwanted missing values in the range images. Besides, almost all previous works fail to consider filling in the unexpected missing values in the PCS task. To alleviate this problem, we first propose a new projection method, namely scan unfolding++ (SU++), to avoid massive missing values in the generated range images. Then, we introduce a simple yet effective approach, namely range-dependent $K$-nearest neighbor interpolation ($K$NNI), to further fill in missing values. Finally, we introduce the Filling Missing Values Network (FMVNet) and Fast FMVNet. Extensive experimental results on SemanticKITTI, SemanticPOSS, and nuScenes datasets demonstrate that by employing the proposed SU++ and $K$NNI, existing range image-based PCS models consistently achieve better performance than the baseline models. Besides, both FMVNet and Fast FMVNet achieve state-of-the-art performance in terms of the speed-accuracy trade-off. The proposed methods can be applied to other range image-based tasks and practical applications.
arxiv情報
著者 | Bike Chen,Chen Gong,Juha Röning |
発行日 | 2024-05-16 15:13:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google