PoCo: Point Context Cluster for RGBD Indoor Place Recognition

要約

我々は、屋内RGB-D場所認識タスクのための新しいエンドツーエンドアルゴリズム(PoCo)を発表する。このタスクは、視野の制約と知覚センサーの範囲の狭さに起因する固有の課題を提示する。我々は、最近のContext of Clusters (CoC)を一般化し、エンドツーエンドの学習により、ノイズの多い点群から直接グローバル記述子を抽出する新しいネットワークアーキテクチャを提案する。さらに、大域的記述子表現を強化するために、色と幾何学的モダリティの両方を点特徴に統合することで、アーキテクチャを開発する。公開データセットであるScanNet-PRとARKitを用いて、それぞれ807シナリオと5047シナリオで評価を行った。PoCoはSOTA性能を達成した:ScanNet-PRにおいて、R@1は64.63%を達成し、最良公開結果であるCGis(61.12%)から5.7%改善した;Arkitにおいて、R@1は45.12%を達成し、最良公開結果であるCGis(39.82%)から13.3%改善した。さらに、PoCoは推論時間においてCGisよりも高い効率性(1.75倍高速)を示し、実世界の実験室環境における場所の認識におけるPoCoの有効性を実証した。

要約(オリジナル)

We present a novel end-to-end algorithm (PoCo) for the indoor RGB-D place recognition task, aimed at identifying the most likely match for a given query frame within a reference database. The task presents inherent challenges attributed to the constrained field of view and limited range of perception sensors. We propose a new network architecture, which generalizes the recent Context of Clusters (CoCs) to extract global descriptors directly from the noisy point clouds through end-to-end learning. Moreover, we develop the architecture by integrating both color and geometric modalities into the point features to enhance the global descriptor representation. We conducted evaluations on public datasets ScanNet-PR and ARKit with 807 and 5047 scenarios, respectively. PoCo achieves SOTA performance: on ScanNet-PR, we achieve R@1 of 64.63%, a 5.7% improvement from the best-published result CGis (61.12%); on Arkit, we achieve R@1 of 45.12%, a 13.3% improvement from the best-published result CGis (39.82%). In addition, PoCo shows higher efficiency than CGis in inference time (1.75X-faster), and we demonstrate the effectiveness of PoCo in recognizing places within a real-world laboratory environment.

arxiv情報

著者 Jing Liang,Zhuo Deng,Zheming Zhou,Omid Ghasemalizadeh,Dinesh Manocha,Min Sun,Cheng-Hao Kuo,Arnie Sen
発行日 2024-04-03 17:38:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク