Stable Vectorization of Multiparameter Persistent Homology using Signed Barcodes as Measures

要約

永続的相同性 (PH) は、重み付きグラフなどの幾何学的データのトポロジカル記述子を提供します。これは、解釈可能で、摂動に対して安定し、再ラベル付けなどの下でも不変です。
PH のほとんどのアプリケーションは、1 つのパラメータの場合に焦点を当てています。このケースでは、データが単一の対象量によってフィルタリングされるときに、記述子がデータのトポロジーの変化を要約します。現在では、1 つのパラメータの使用を可能にするさまざまな方法が存在します。
データ サイエンスにおけるパラメータ PH 記述子。これは、ヒルベルト空間の要素としてのこれらの記述子の安定したベクトル化に依存します。
いくつかの対象量でフィルタリングされたデータのマルチパラメータ PH (MPH) は、1 パラメータの対応物よりもはるかに豊富な情報をエンコードしますが、MPH 記述子の安定性結果が不足しているため、これまで MPH の安定したベクトル化に利用できるオプションは限られていました。
この論文では、署名付きバーコード (MPH 記述子の最近のファミリー) を署名付きメジャーとして解釈することで、1 つのパラメーターから複数のパラメーターへのベクトル化戦略の自然な拡張がどのように行われるかを示すことで、両方の長所を組み合わせることを目的としています。
結果として得られる特徴ベクトルは定義と計算が簡単で、安定していることが証明されています。
概念実証として、署名付きバーコードとベクトル化の単純な選択に焦点を当てていますが、特徴ベクトルをさまざまなタイプのデータに対する最先端のトポロジーベースの手法と比較すると、すでに顕著なパフォーマンスの向上が見られます。

要約(オリジナル)

Persistent homology (PH) provides topological descriptors for geometric data, such as weighted graphs, which are interpretable, stable to perturbations, and invariant under, e.g., relabeling. Most applications of PH focus on the one-parameter case — where the descriptors summarize the changes in topology of data as it is filtered by a single quantity of interest — and there is now a wide array of methods enabling the use of one-parameter PH descriptors in data science, which rely on the stable vectorization of these descriptors as elements of a Hilbert space. Although the multiparameter PH (MPH) of data that is filtered by several quantities of interest encodes much richer information than its one-parameter counterpart, the scarceness of stability results for MPH descriptors has so far limited the available options for the stable vectorization of MPH. In this paper, we aim to bring together the best of both worlds by showing how the interpretation of signed barcodes — a recent family of MPH descriptors — as signed measures leads to natural extensions of vectorization strategies from one parameter to multiple parameters. The resulting feature vectors are easy to define and to compute, and provably stable. While, as a proof of concept, we focus on simple choices of signed barcodes and vectorizations, we already see notable performance improvements when comparing our feature vectors to state-of-the-art topology-based methods on various types of data.

arxiv情報

著者 David Loiseaux,Luis Scoccola,Mathieu Carrière,Magnus Bakke Botnan,Steve Oudot
発行日 2023-06-06 15:45:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.LG, math.AT, stat.ML パーマリンク