Resampling and averaging coordinates on data

要約

点群の固有座標をロバストに計算するアルゴリズムを紹介する。我々のアプローチは、データをサブサンプリングし、埋め込みアルゴリズム(例えば多様体学習)のハイパーパラメータを変化させることにより、多数の座標候補を生成することに依存する。次に、候補座標のコレクションをクラスタリングし、トポロジカルデータ解析から得られた形状記述子を用いることで、代表的な埋込みのサブセットを特定する。最終的な出力は、一般化されたプロクラステス分析を用いて、代表埋込みの平均として得られる埋込みである。本アルゴリズムを、合成データとゲノミクスの実験的測定値の両方で検証し、ノイズや外れ値に対する頑健性を実証する。

要約(オリジナル)

We introduce algorithms for robustly computing intrinsic coordinates on point clouds. Our approach relies on generating many candidate coordinates by subsampling the data and varying hyperparameters of the embedding algorithm (e.g., manifold learning). We then identify a subset of representative embeddings by clustering the collection of candidate coordinates and using shape descriptors from topological data analysis. The final output is the embedding obtained as an average of the representative embeddings using generalized Procrustes analysis. We validate our algorithm on both synthetic data and experimental measurements from genomics, demonstrating robustness to noise and outliers.

arxiv情報

著者 Andrew J. Blumberg,Mathieu Carriere,Jun Hou Fung,Michael A. Mandell
発行日 2024-08-02 16:37:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CG, cs.LG, stat.ML パーマリンク