HADES: Fast Singularity Detection with Local Measure Comparison

要約

データの特異点を検出するための教師なしアルゴリズムである Hades を紹介します。
このアルゴリズムはカーネル適合度テストを採用しているため、既存のトポロジベースの代替アルゴリズムよりもはるかに高速で、はるかに拡張性が高くなります。
微分幾何学と最適輸送理論のツールを使用して、データ サンプルが等次元多様体の横断交差上に存在する場合、Hades が高確率で特異点を正確に検出することを証明します。
計算実験では、Hades は合成的に生成されたデータの特異点、道路網データの分岐点、分子構造空間の交差リング、画像データの異常を回復します。

要約(オリジナル)

We introduce Hades, an unsupervised algorithm to detect singularities in data. This algorithm employs a kernel goodness-of-fit test, and as a consequence it is much faster and far more scaleable than the existing topology-based alternatives. Using tools from differential geometry and optimal transport theory, we prove that Hades correctly detects singularities with high probability when the data sample lives on a transverse intersection of equidimensional manifolds. In computational experiments, Hades recovers singularities in synthetically generated data, branching points in road network data, intersection rings in molecular conformation space, and anomalies in image data.

arxiv情報

著者 Uzu Lim,Harald Oberhauser,Vidit Nanda
発行日 2023-11-07 17:54:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 32S50, 55N31, cs.AI, cs.LG, math.AT, math.DG, math.ST, stat.TH パーマリンク