要約
点群レジストレーションは、コンピュータビジョンやロボット工学における多くのアプリケーションの前提条件である。既存の手法の多くは、重なりが大きい2つの点群のペアワイズ登録に焦点を当てている。重なりが少ない場合の手法もあるが、劣化したシナリオでは苦戦を強いられる。本論文では、LiDARフィデューシャルマーカーを活用し、順序のない重なりの少ないマルチビュー点群を登録するために設計された、L-PRと呼ばれる新しいフレームワークを紹介する。LiDARフィデューシャルマーカーと呼ぶが、これは一般的なAprilTagやArUcoマーカーと同じで、環境の3D形状に影響を与えない薄い紙である。我々はまず、点群間の視点が劇的に変化する場合にロバストな検出結果を提供するために、改良された適応的閾値マーカー検出法を提案する。次に、非順序多視点点群登録問題を最大事後(maximum a-posteriori: MAP)問題として定式化し、これに対処するために2つのレベルのグラフからなるフレームワークを開発する。第1レベルのグラフは重み付きグラフとして構成され、順序なし集合からスキャンポーズの初期値を効率的かつ最適に推論するように設計されている。第2レベルのグラフは因子グラフとして構成される。スキャンポーズ、マーカーポーズ、マーカーコーナー位置を含むグラフ上の変数を大域的に最適化することにより、MAP問題に取り組む。我々は定性的・定量的な実験を行い、提案手法が従来の最先端手法(SOTA)を凌駕することを実証し、L-PRが3Dアセット収集とトレーニングデータ収集のための低コストで効率的なツールとして機能することを示す。特に、L-PRを用いてLivox-3DMatchという新しいデータセットを収集し、それをSOTA学習ベースの手法であるSGHRの学習に組み込むことで、様々なベンチマークにおいてSGHRに明らかな改善をもたらす。
要約(オリジナル)
Point cloud registration is a prerequisite for many applications in computer vision and robotics. Most existing methods focus on pairwise registration of two point clouds with high overlap. Although there have been some methods for low overlap cases, they struggle in degraded scenarios. This paper introduces a novel framework dubbed L-PR, designed to register unordered low overlap multiview point clouds leveraging LiDAR fiducial markers. We refer to them as LiDAR fiducial markers, but they are the same as the popular AprilTag and ArUco markers, thin sheets of paper that do not affect the 3D geometry of the environment. We first propose an improved adaptive threshold marker detection method to provide robust detection results when the viewpoints among point clouds change dramatically. Then, we formulate the unordered multiview point cloud registration problem as a maximum a-posteriori (MAP) problem and develop a framework consisting of two levels of graphs to address it. The first-level graph, constructed as a weighted graph, is designed to efficiently and optimally infer initial values of scan poses from the unordered set. The second-level graph is constructed as a factor graph. By globally optimizing the variables on the graph, including scan poses, marker poses, and marker corner positions, we tackle the MAP problem. We conduct both qualitative and quantitative experiments to demonstrate that the proposed method surpasses previous state-of-the-art (SOTA) methods and to showcase that L-PR can serve as a low-cost and efficient tool for 3D asset collection and training data collection. In particular, we collect a new dataset named Livox-3DMatch using L-PR and incorporate it into the training of the SOTA learning-based method, SGHR, which brings evident improvements for SGHR on various benchmarks.
arxiv情報
著者 | Yibo Liu,Jinjun Shan,Amaldev Haridevan,Shuo Zhang |
発行日 | 2024-08-02 05:26:14+00:00 |
arxivサイト | arxiv_id(pdf) |