Fast LiDAR Upsampling using Conditional Diffusion Models

要約

3D LiDAR データを改良する研究は、教師あり学習や生成モデルベースの手法などの最近の技術によって動機付けられ、関心が高まっています。
既存のアプローチは、拡散モデルを使用して精度の高い洗練された LiDAR データを生成する可能性を示していますが、そのような方法のパフォーマンスと速度には制限があります。
これらの制限により、リアルタイムでの実行が困難になり、自律ナビゲーションや人間とロボットの対話などの現実世界のタスクでアプローチが困難になります。
この研究では、画像表現を通じて 3D シーン点群の疎から密への高速かつ高品質なアップサンプリングのための、条件付き拡散モデルに基づく新しいアプローチを導入します。
私たちの手法は、条件付き修復マスクでトレーニングされたノイズ除去拡散確率モデルを採用しており、画像補完タスクで高いパフォーマンスを発揮することがわかっています。
複数のデータセット、サンプリング ステップ、条件付きマスクを含む一連の実験を紹介します。
この論文では、KITTI-360 データセットを使用したアップサンプリング タスクにおいて、私たちの手法がサンプリング速度と品質においてベースラインを上回っていることを示しています。
さらに、現実世界と合成データセットで同時にトレーニングし、品質と環境に差異を導入することで、アプローチの一般化能力を示します。

要約(オリジナル)

The search for refining 3D LiDAR data has attracted growing interest motivated by recent techniques such as supervised learning or generative model-based methods. Existing approaches have shown the possibilities for using diffusion models to generate refined LiDAR data with high fidelity, although the performance and speed of such methods have been limited. These limitations make it difficult to execute in real-time, causing the approaches to struggle in real-world tasks such as autonomous navigation and human-robot interaction. In this work, we introduce a novel approach based on conditional diffusion models for fast and high-quality sparse-to-dense upsampling of 3D scene point clouds through an image representation. Our method employs denoising diffusion probabilistic models trained with conditional inpainting masks, which have been shown to give high performance on image completion tasks. We introduce a series of experiments, including multiple datasets, sampling steps, and conditional masks. This paper illustrates that our method outperforms the baselines in sampling speed and quality on upsampling tasks using the KITTI-360 dataset. Furthermore, we illustrate the generalization ability of our approach by simultaneously training on real-world and synthetic datasets, introducing variance in quality and environments.

arxiv情報

著者 Sander Elias Magnussen Helgesen,Kazuto Nakashima,Jim Tørresen,Ryo Kurazume
発行日 2024-07-23 06:51:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク