Dimension Reduction with Prior Information for Knowledge Discovery

要約

この論文では、他の既知の特徴が存在する場合に、高次元データを低次元空間にマッピングする問題を取り上げます。
ほとんどのアプリケーションには制御可能/測定可能な機能が存在することが多いため、この問題は科学と工学のいたるところに存在します。
この問題を解決するために、この論文では、条件付き多次元スケーリング (MDS) と呼ばれる広範なクラスの方法を提案します。
条件付きMDSの目的関数を最適化するアルゴリズムも開発されています。
このアルゴリズムの収束は穏やかな仮定の下で証明されています。
条件付き MDS は、親族関係の用語、顔の表情、織物、自動車ブランドの認識、シリンダー加工の例で説明されています。
これらの例は、次元削減空間の推定品質を向上させ、視覚化および知識発見タスクを簡素化するという点で、従来の次元削減に比べて条件付き MDS の利点を示しています。
この作業用のコンピューター コードは、オープンソースの cml R パッケージで入手できます。

要約(オリジナル)

This paper addresses the problem of mapping high-dimensional data to a low-dimensional space, in the presence of other known features. This problem is ubiquitous in science and engineering as there are often controllable/measurable features in most applications. To solve this problem, this paper proposes a broad class of methods, which is referred to as conditional multidimensional scaling (MDS). An algorithm for optimizing the objective function of conditional MDS is also developed. The convergence of this algorithm is proven under mild assumptions. Conditional MDS is illustrated with kinship terms, facial expressions, textile fabrics, car-brand perception, and cylinder machining examples. These examples demonstrate the advantages of conditional MDS over conventional dimension reduction in improving the estimation quality of the reduced-dimension space and simplifying visualization and knowledge discovery tasks. Computer codes for this work are available in the open-source cml R package.

arxiv情報

著者 Anh Tuan Bui
発行日 2023-12-29 14:03:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク