A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams

要約

パーシステンス ダイアグラム (PD) はトポロジカル データ分析で中心的な役割を果たし、ますます多様なアプリケーションで使用されています。
PD データの比較には、正確で、理論的に健全で、高速に計算できるメトリックを使用して、大規模な PD セット間の比較メトリックを計算する必要があります。
特に、より高密度の多次元 PD の場合、そのような比較指標が不足しています。
Wasserstein タイプの距離は高い精度と理論的保証を備えていますが、高い計算コストがかかります。
一方、永続統計 (PS) などのベクトル化間の距離は、計算コストが低くなりますが、精度の保証がなく、一般に PD を区別することが保証されていません (つまり、異なる PD の 2 つの PS ベクトルが等しい可能性があります)。
この研究では、拡張トポロジカル擬似距離 (ETD) と呼ばれる擬似距離のクラスを導入します。これは、調整可能な複雑度を持ち、複雑度の高い極限ではスライス距離と古典的なワッサーシュタイン距離を近似できますが、複雑さの低い部分では計算が軽く、永続統計に近くなります。
複雑さが非常に高いため、ユーザーは 2 つのメトリクスの間を補間することができます。
理論的な比較を構築して、永続性ベクトル化と Wasserstein 距離の間の中間レベルで新しい距離を適合させる方法を示します。
また、ETD は精度の点で PS よりも優れており、計算の複雑さの点で Wasserstein および Sliced Wasserstein 距離よりも優れていることも実験的に検証しています。

要約(オリジナル)

Persistence diagrams (PD)s play a central role in topological data analysis, and are used in an ever increasing variety of applications. The comparison of PD data requires computing comparison metrics among large sets of PDs, with metrics which are accurate, theoretically sound, and fast to compute. Especially for denser multi-dimensional PDs, such comparison metrics are lacking. While on the one hand, Wasserstein-type distances have high accuracy and theoretical guarantees, they incur high computational cost. On the other hand, distances between vectorizations such as Persistence Statistics (PS)s have lower computational cost, but lack the accuracy guarantees and in general they are not guaranteed to distinguish PDs (i.e. the two PS vectors of different PDs may be equal). In this work we introduce a class of pseudodistances called Extended Topological Pseudodistances (ETD)s, which have tunable complexity, and can approximate Sliced and classical Wasserstein distances at the high-complexity extreme, while being computationally lighter and close to Persistence Statistics at the lower complexity extreme, and thus allow users to interpolate between the two metrics. We build theoretical comparisons to show how to fit our new distances at an intermediate level between persistence vectorizations and Wasserstein distances. We also experimentally verify that ETDs outperform PSs in terms of accuracy and outperform Wasserstein and Sliced Wasserstein distances in terms of computational complexity.

arxiv情報

著者 Rolando Kindelan Nuñez,Mircea Petrache,Mauricio Cerda,Nancy Hitschfeld
発行日 2024-02-22 12:27:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 55N31, 62R07, 62R40, 68T09, 68T10, cs.CG, cs.CV, cs.LG, I.2, math.AT パーマリンク