Metric Space Magnitude for Evaluating Unsupervised Representation Learning

要約

計量空間の大きさは、新しい不変量として最近確立され、複数のスケールにわたる空間の「有効サイズ」の尺度を提供します。
データの幾何学的特性と位相幾何学的特性の両方を捕捉することにより、マグニチュードは教師なし表現学習タスクにおける課題に対処する準備が整っています。
有限計量空間の大きさ関数間の非類似性に関する新しい概念を形式化し、それらを使用して次元削減タスクの品質尺度を導き出します。
私たちの尺度はデータの摂動の下でも安定していることが証明されており、効率的に計算でき、埋め込みの厳密なマルチスケール比較が可能です。
データ視覚化の比較など、さまざまなドメインとタスクで構成される実験スイートにおける測定の有用性を示します。

要約(オリジナル)

The magnitude of a metric space was recently established as a novel invariant, providing a measure of the `effective size’ of a space across multiple scales. By capturing both geometrical and topological properties of data, magnitude is poised to address challenges in unsupervised representation learning tasks. We formalise a novel notion of dissimilarity between magnitude functions of finite metric spaces and use them to derive a quality measure for dimensionality reduction tasks. Our measure is provably stable under perturbations of the data, can be efficiently calculated, and enables a rigorous multi-scale comparison of embeddings. We show the utility of our measure in an experimental suite that comprises different domains and tasks, including the comparison of data visualisations.

arxiv情報

著者 Katharina Limbeck,Rayna Andreeva,Rik Sarkar,Bastian Rieck
発行日 2023-11-27 18:19:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.GT, stat.ML パーマリンク