A Near-Linear Time Algorithm for the Chamfer Distance

要約

サイズが $n$ までの任意の 2 つの点セット $A,B \subset \mathbb{R}^d$ について、$A$ から $B$ までの面取り距離は $\text{CH}(A,
B)=\sum_{a \in A} \min_{b \in B} d_X(a,b)$、ここで $d_X$ は基礎となる距離の尺度 (ユークリッド距離やマンハッタン距離など) です。
面取り距離は、点群間の非類似性の一般的な尺度であり、多くの機械学習、コンピューター ビジョン、グラフィックス アプリケーションで使用され、直接的な $O(d n^2)$ 回のブルート フォース アルゴリズムを可能にします。
さらに、面取り距離は、計算がより要求されるアース・ムーバー (最適な輸送) 距離の代用としてよく使用されます。
ただし、実行時間は \emph{quadratic} が $n$ に依存するため、大規模なデータセットでは単純なアプローチは扱いにくくなります。
我々はこのボトルネックを克服し、ほぼ線形の実行時間で面取り距離を推定するための最初の $(1+\epsilon)$ 近似アルゴリズムを提案します。
具体的には、私たちのアルゴリズムは $O(nd \log (n)/\varepsilon^2)$ 以内に実行され、実装可能です。
私たちの実験では、大規模な高次元データセットに対して正確かつ高速であることが実証されています。
私たちは、私たちのアルゴリズムが大規模な高次元点群を分析するための新しい道を開くと信じています。
また、目標が $A$ から $B$ への $(1+\varepsilon)$ 近似マッピング (その値だけではなく) を \emph{report} することである場合、二次二次時間は必要であるという証拠も示します。
アルゴリズムが存在する可能性は低いです。

要約(オリジナル)

For any two point sets $A,B \subset \mathbb{R}^d$ of size up to $n$, the Chamfer distance from $A$ to $B$ is defined as $\text{CH}(A,B)=\sum_{a \in A} \min_{b \in B} d_X(a,b)$, where $d_X$ is the underlying distance measure (e.g., the Euclidean or Manhattan distance). The Chamfer distance is a popular measure of dissimilarity between point clouds, used in many machine learning, computer vision, and graphics applications, and admits a straightforward $O(d n^2)$-time brute force algorithm. Further, the Chamfer distance is often used as a proxy for the more computationally demanding Earth-Mover (Optimal Transport) Distance. However, the \emph{quadratic} dependence on $n$ in the running time makes the naive approach intractable for large datasets. We overcome this bottleneck and present the first $(1+\epsilon)$-approximate algorithm for estimating the Chamfer distance with a near-linear running time. Specifically, our algorithm runs in time $O(nd \log (n)/\varepsilon^2)$ and is implementable. Our experiments demonstrate that it is both accurate and fast on large high-dimensional datasets. We believe that our algorithm will open new avenues for analyzing large high-dimensional point clouds. We also give evidence that if the goal is to \emph{report} a $(1+\varepsilon)$-approximate mapping from $A$ to $B$ (as opposed to just its value), then any sub-quadratic time algorithm is unlikely to exist.

arxiv情報

著者 Ainesh Bakshi,Piotr Indyk,Rajesh Jayaram,Sandeep Silwal,Erik Waingarten
発行日 2023-07-06 15:07:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.DS, cs.GR, cs.LG パーマリンク