要約
知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応するコンピュータービジョンアルゴリズムを組み込んでいます。
3D LiDAR センサーは、車両周囲のまばらな点群をキャプチャするために広く使用されています。
ただし、このようなシステムは、点群がまばらであり、セマンティクスが欠如しているため、シーン内の遮蔽された領域やギャップを認識するのに苦労します。
これらの課題に対処するために、セマンティック シーン補完 (SSC) は、未加工の LiDAR 測定値を与えられたシーン内の未観測のジオメトリとセマンティクスを共同で予測し、より完全なシーン表現を目指します。
画像生成および超解像度タスクにおける拡散モデルの有望な結果に基づいて、点空間および意味論的空間でのノイズ除去およびノイズ除去拡散プロセスを個別に実装することによる、SSC への拡張モデルを提案します。
生成を制御するために、条件付き入力としてセマンティック LiDAR 点群を採用し、ローカルおよびグローバルの正則化損失を設計してノイズ除去プロセスを安定させます。
私たちは自動運転データセットに対する当社のアプローチを評価しており、当社のアプローチは SSC の最先端のものを上回っています。
要約(オリジナル)
Perception systems play a crucial role in autonomous driving, incorporating multiple sensors and corresponding computer vision algorithms. 3D LiDAR sensors are widely used to capture sparse point clouds of the vehicle’s surroundings. However, such systems struggle to perceive occluded areas and gaps in the scene due to the sparsity of these point clouds and their lack of semantics. To address these challenges, Semantic Scene Completion (SSC) jointly predicts unobserved geometry and semantics in the scene given raw LiDAR measurements, aiming for a more complete scene representation. Building on promising results of diffusion models in image generation and super-resolution tasks, we propose their extension to SSC by implementing the noising and denoising diffusion processes in the point and semantic spaces individually. To control the generation, we employ semantic LiDAR point clouds as conditional input and design local and global regularization losses to stabilize the denoising process. We evaluate our approach on autonomous driving datasets and our approach outperforms the state-of-the-art for SSC.
arxiv情報
著者 | Helin Cao,Sven Behnke |
発行日 | 2024-09-30 18:14:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google