Diff-PCR: Diffusion-Based Correspondence Searching in Doubly Stochastic Matrix Space for Point Cloud Registration

要約

点群間の最適な対応関係を効率的に見つけることは、剛体点群と非剛体点群の両方の位置合わせ問題を解決するために重要です。
既存の方法は、多くの場合、幾何学的または意味論的な特徴の埋め込みに依存して、対応関係を確立し、変換または流れ場を推定します。
最近、最先端の手法では、RAFT のような反復更新を採用してソリューションを改良しています。
ただし、これらの方法には一定の制限があります。
まず、反復的な改良設計には透明性が欠けており、反復的な更新は改良プロセス中に固定パスに従うため、次善の結果が生じる可能性があります。
第二に、これらの方法は、変換または流れ場を解決するための前段階として、対応関係 (または行列のマッチング) を洗練または最適化することの重要性を見落としています。
通常、ポイント フィーチャ空間内の距離に基づいて候補の対応関係を計算します。
ただし、最終的な対応関係を取得するために、Sinkhorn 演算またはデュアル ソフトマックス演算を使用して、候補マッチング行列を何らかの行列空間に一度射影するだけです。
このワンショット投影マッチング行列は、全体的に最適なマッチング行列からは程遠い可能性があり、これらのアプローチはターゲットマッチング行列の分布を考慮していません。
この論文では、ノイズ除去拡散モデルを利用して二重確率行列空間内で最適なマッチング行列の検索勾配を予測する新しいアプローチを提案します。
逆ノイズ除去プロセス中、私たちの方法は、ターゲットのマッチング行列の最尤方向を指すこのノイズ除去勾配に沿って、より良いソリューションを繰り返し検索します。
私たちの方法では、オンライン バックボーンまたはホワイト ノイズによって提供される初期マッチング マトリックスから検索を開始できるため、柔軟性が得られます。
3DMatch/3DLoMatch および 4DMatch/4DLoMatch データセットの実験評価により、新しく設計されたフレームワークの有効性が実証されました。

要約(オリジナル)

Efficiently finding optimal correspondences between point clouds is crucial for solving both rigid and non-rigid point cloud registration problems. Existing methods often rely on geometric or semantic feature embedding to establish correspondences and estimate transformations or flow fields. Recently, state-of-the-art methods have employed RAFT-like iterative updates to refine the solution. However, these methods have certain limitations. Firstly, their iterative refinement design lacks transparency, and their iterative updates follow a fixed path during the refinement process, which can lead to suboptimal results. Secondly, these methods overlook the importance of refining or optimizing correspondences (or matching matrices) as a precursor to solving transformations or flow fields. They typically compute candidate correspondences based on distances in the point feature space. However, they only project the candidate matching matrix into some matrix space once with Sinkhorn or dual softmax operations to obtain final correspondences. This one-shot projected matching matrix may be far from the globally optimal one, and these approaches do not consider the distribution of the target matching matrix. In this paper, we propose a novel approach that exploits the Denoising Diffusion Model to predict a searching gradient for the optimal matching matrix within the Doubly Stochastic Matrix Space. During the reverse denoising process, our method iteratively searches for better solutions along this denoising gradient, which points towards the maximum likelihood direction of the target matching matrix. Our method offers flexibility by allowing the search to start from any initial matching matrix provided by the online backbone or white noise. Experimental evaluations on the 3DMatch/3DLoMatch and 4DMatch/4DLoMatch datasets demonstrate the effectiveness of our newly designed framework.

arxiv情報

著者 Qianliang Wu,Haobo Jiang,Yaqing Ding,Lei Luo,Jin Xie,Jian Yang
発行日 2024-01-16 04:17:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク