A Near-Linear Time Algorithm for the Chamfer Distance


サイズが $n$ までの任意の 2 つの点セット $A,B \subset \mathbb{R}^d$ について、$A$ から $B$ までの面取り距離は $\text{CH}(A,
B)=\sum_{a \in A} \min_{b \in B} d_X(a,b)$、ここで $d_X$ は基礎となる距離の尺度 (ユークリッド距離やマンハッタン距離など) です。
面取り距離は、点群間の非類似性の一般的な尺度であり、多くの機械学習、コンピューター ビジョン、グラフィックス アプリケーションで使用され、直接的な $O(d n^2)$ 回のブルート フォース アルゴリズムを可能にします。
さらに、面取り距離は、計算がより要求されるアース・ムーバー (最適な輸送) 距離の代用としてよく使用されます。
ただし、実行時間は \emph{quadratic} が $n$ に依存するため、大規模なデータセットでは単純なアプローチは扱いにくくなります。
我々はこのボトルネックを克服し、ほぼ線形の実行時間で面取り距離を推定するための最初の $(1+\epsilon)$ 近似アルゴリズムを提案します。
具体的には、私たちのアルゴリズムは $O(nd \log (n)/\varepsilon^2)$ 以内に実行され、実装可能です。
また、目標が $A$ から $B$ への $(1+\varepsilon)$ 近似マッピング (その値だけではなく) を \emph{report} することである場合、二次二次時間は必要であるという証拠も示します。


For any two point sets $A,B \subset \mathbb{R}^d$ of size up to $n$, the Chamfer distance from $A$ to $B$ is defined as $\text{CH}(A,B)=\sum_{a \in A} \min_{b \in B} d_X(a,b)$, where $d_X$ is the underlying distance measure (e.g., the Euclidean or Manhattan distance). The Chamfer distance is a popular measure of dissimilarity between point clouds, used in many machine learning, computer vision, and graphics applications, and admits a straightforward $O(d n^2)$-time brute force algorithm. Further, the Chamfer distance is often used as a proxy for the more computationally demanding Earth-Mover (Optimal Transport) Distance. However, the \emph{quadratic} dependence on $n$ in the running time makes the naive approach intractable for large datasets. We overcome this bottleneck and present the first $(1+\epsilon)$-approximate algorithm for estimating the Chamfer distance with a near-linear running time. Specifically, our algorithm runs in time $O(nd \log (n)/\varepsilon^2)$ and is implementable. Our experiments demonstrate that it is both accurate and fast on large high-dimensional datasets. We believe that our algorithm will open new avenues for analyzing large high-dimensional point clouds. We also give evidence that if the goal is to \emph{report} a $(1+\varepsilon)$-approximate mapping from $A$ to $B$ (as opposed to just its value), then any sub-quadratic time algorithm is unlikely to exist.


著者 Ainesh Bakshi,Piotr Indyk,Rajesh Jayaram,Sandeep Silwal,Erik Waingarten
発行日 2023-07-06 15:07:48+00:00
arxivサイト arxiv_id(pdf)

