要約
最近、特に LiDAR センサーなどの最新の取得機器を使用することにより、実際の大規模屋外 3D 環境のセンシングにおいて大きな進歩が達成されました。
残念ながら、高密度で完全な 3D シーンを生成する能力には基本的に限界があります。
この問題に対処するために、最近の学習ベースの手法では、ニューラル暗黙的表現と最適化可能な特徴グリッドを統合して、3D シーンの表面を近似します。
ただし、生の LiDAR 光線に沿ってサンプルを単純にフィッティングすると、まばらで矛盾する LiDAR 測定値の性質により、ノイズの多い 3D マッピング結果が得られます。
代わりに、この研究では、LiDAR データを正確にフィッティングすることから離れ、代わりにネットワークに 3D 空間で定義された非計量単調暗黙的フィールドを最適化させます。
私たちの分野に合わせて、神経単調場の最適化を可能にし、大規模 3D マッピングにおける最近の進歩を活用する単調性損失を統合した学習システムを設計します。
当社のアルゴリズムは、Mai City、Newer College、KITTI ベンチマークで得られた複数の定量的および知覚的測定と視覚的結果によって捕捉された、高品質の高密度 3D マッピング パフォーマンスを実現します。
私たちのアプローチのコードは公開される予定です。
要約(オリジナル)
Recently, significant progress has been achieved in sensing real large-scale outdoor 3D environments, particularly by using modern acquisition equipment such as LiDAR sensors. Unfortunately, they are fundamentally limited in their ability to produce dense, complete 3D scenes. To address this issue, recent learning-based methods integrate neural implicit representations and optimizable feature grids to approximate surfaces of 3D scenes. However, naively fitting samples along raw LiDAR rays leads to noisy 3D mapping results due to the nature of sparse, conflicting LiDAR measurements. Instead, in this work we depart from fitting LiDAR data exactly, instead letting the network optimize a non-metric monotonic implicit field defined in 3D space. To fit our field, we design a learning system integrating a monotonicity loss that enables optimizing neural monotonic fields and leverages recent progress in large-scale 3D mapping. Our algorithm achieves high-quality dense 3D mapping performance as captured by multiple quantitative and perceptual measures and visual results obtained for Mai City, Newer College, and KITTI benchmarks. The code of our approach will be made publicly available.
arxiv情報
著者 | Kutay Yılmaz,Matthias Nießner,Anastasiia Kornilova,Alexey Artemov |
発行日 | 2024-08-28 10:52:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google