要約
これは、IEEE/RSJ IROS 2025に提出されたペーパーのARXIVバージョンです。3Dラインをコンパクトマップ表現として意味的にラベル付けするシーンに依存して軽量の視覚再局在化フレームワークを提案します。
私たちのフレームワークでは、ロボットは単一の画像をキャプチャし、2Dラインを抽出し、マップ内の意味的に類似した3D行に関連付け、堅牢なPerspective-n-Lineの問題を解決することにより、それ自体をローカライズします。
セマンティックマッチングの1対多くのあいまいさによって引き起こされる非常に高い異常な比率〜(99.5 \%を超える)に対処するために、飽和コンセンサスの最大化〜(SAT-CM)定式化を導入します。
さらに、策定されたSAT-CM問題に対する高速グローバルソルバーを提案し、厳密なインターバル分析結果を活用して、精度と計算効率の両方を確保します。
さらに、Posed Depth Imagesを使用してセマンティック3Dラインマップを構築するためのパイプラインを開発します。
堅牢な推定と実用的なエンジニアリングの洞察に革新を統合するフレームワークの有効性を検証するために、Scannet ++データセットで広範な実験を実施します。
要約(オリジナル)
This is the arxiv version for our paper submitted to IEEE/RSJ IROS 2025. We propose a scene-agnostic and light-weight visual relocalization framework that leverages semantically labeled 3D lines as a compact map representation. In our framework, the robot localizes itself by capturing a single image, extracting 2D lines, associating them with semantically similar 3D lines in the map, and solving a robust perspective-n-line problem. To address the extremely high outlier ratios~(exceeding 99.5\%) caused by one-to-many ambiguities in semantic matching, we introduce the Saturated Consensus Maximization~(Sat-CM) formulation, which enables accurate pose estimation when the classic Consensus Maximization framework fails. We further propose a fast global solver to the formulated Sat-CM problems, leveraging rigorous interval analysis results to ensure both accuracy and computational efficiency. Additionally, we develop a pipeline for constructing semantic 3D line maps using posed depth images. To validate the effectiveness of our framework, which integrates our innovations in robust estimation and practical engineering insights, we conduct extensive experiments on the ScanNet++ dataset.
arxiv情報
著者 | Haodong Jiang,Xiang Zheng,Yanglin Zhang,Qingcheng Zeng,Yiqian Li,Ziyang Hong,Junfeng Wu |
発行日 | 2025-03-05 08:13:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google