That’s My Point: Compact Object-centric LiDAR Pose Estimation for Large-scale Outdoor Localisation


このペーパーは、スケーラブルなマッピングと位置特定を可能にする、極めて最小限のストレージ要件での LiDAR スキャンでの 3D 姿勢推定に関するものです。
これは、セグメント化されたスキャンのすべてのポイントをセマンティック オブジェクトにクラスタリングし、それらをそれぞれの重心とセマンティック クラスのみで表すことによって実現します。
このようにして、各 LiDAR スキャンは 4 つの数のベクトルのコンパクトなコレクションに縮小されます。
これを軽減するために、エンティティ間の幾何学的および意味論的な関係を捕捉する自己相関および相互相関に基づくオブジェクト マッチング ネットワークを導入します。
それぞれの一致により、重み付き特異値分解 (SVD) と RANdom SAmple Consensus (RANSAC) を通じてスキャン間の相対変換を回復できます。
我々は、KITTI データセット上のさまざまな視点で撮影された点群を登録し、KITTI と KITTI-360 の間で位置を特定するさまざまな期間に、このような表現が計量位置特定に十分であることを実証します。
当社は、表現サイズのほぼ半分、具体的には平均 1.33 kB で、最先端の手法に匹敵する正確なメトリクス推定を達成します。


This paper is about 3D pose estimation on LiDAR scans with extremely minimal storage requirements to enable scalable mapping and localisation. We achieve this by clustering all points of segmented scans into semantic objects and representing them only with their respective centroid and semantic class. In this way, each LiDAR scan is reduced to a compact collection of four-number vectors. This abstracts away important structural information from the scenes, which is crucial for traditional registration approaches. To mitigate this, we introduce an object-matching network based on self- and cross-correlation that captures geometric and semantic relationships between entities. The respective matches allow us to recover the relative transformation between scans through weighted Singular Value Decomposition (SVD) and RANdom SAmple Consensus (RANSAC). We demonstrate that such representation is sufficient for metric localisation by registering point clouds taken under different viewpoints on the KITTI dataset, and at different periods of time localising between KITTI and KITTI-360. We achieve accurate metric estimates comparable with state-of-the-art methods with almost half the representation size, specifically 1.33 kB on average.


著者 Georgi Pramatarov,Matthew Gadd,Paul Newman,Daniele De Martini
発行日 2024-03-07 18:55:30+00:00
