Feature Learning for Nonlinear Dimensionality Reduction toward Maximal Extraction of Hidden Patterns

要約

次元削減 (DR) は、高次元データの視覚的分析において重要な役割を果たします。
DR の主な目的の 1 つは、固有の低次元多様体上にある隠れたパターンを明らかにすることです。
ただし、多様体が特定の影響力のあるデータ属性によって歪められたりマスクされたりすると、DR は重要なパターンを見落とすことがよくあります。
この論文では、隠れ多様体の重要なパターンを捕捉するために、非線形 DR 用に最適化された一連のデータ予測を生成するように設計された特徴学習フレームワーク、FEALM を紹介します。
これらの予測は、結果として得られる DR の結果が大きく異なるように、最大​​限に異なる最近傍グラフを生成します。
このような機能を実現するために、最適化アルゴリズムを設計し、neighbor-shape dissimilarity という名前の新しいグラフ非類似度測定を導入します。
さらに、得られたDR結果の比較と各DR結果の解釈を支援するインタラクティブな視覚化を開発します。
合成データセットと実世界のデータセットを使用した実験とケーススタディを通じて、FEALM の有効性を実証します。

要約(オリジナル)

Dimensionality reduction (DR) plays a vital role in the visual analysis of high-dimensional data. One main aim of DR is to reveal hidden patterns that lie on intrinsic low-dimensional manifolds. However, DR often overlooks important patterns when the manifolds are distorted or masked by certain influential data attributes. This paper presents a feature learning framework, FEALM, designed to generate a set of optimized data projections for nonlinear DR in order to capture important patterns in the hidden manifolds. These projections produce maximally different nearest-neighbor graphs so that resultant DR outcomes are significantly different. To achieve such a capability, we design an optimization algorithm as well as introduce a new graph dissimilarity measure, named neighbor-shape dissimilarity. Additionally, we develop interactive visualizations to assist comparison of obtained DR results and interpretation of each DR result. We demonstrate FEALM’s effectiveness through experiments and case studies using synthetic and real-world datasets.

arxiv情報

著者 Takanori Fujiwara,Yun-Hsin Kuo,Anders Ynnerman,Kwan-Liu Ma
発行日 2023-02-15 17:37:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク