t-viSNE: Interactive Assessment and Interpretation of t-SNE Projections

要約

多次元データを視覚化するための t 分散確率的近傍埋め込み (t-SNE) は、幅広い分野での応用例により、一般的なアプローチであることが証明されています。
t-SNE 予測は有用であるにもかかわらず、解釈が難しく、誤解を招く可能性があり、結果の信頼性が損なわれます。
t-SNE 自体の詳細と、その出力における特定のパターンの背後にある理由を理解することは、特に次元削減の専門家以外にとっては困難な作業となる可能性があります。
この研究では、t-SNE 投影を視覚的に探索するための対話型ツールである t-viSNE を紹介します。これにより、分析者は、ハイパーパラメータの効果、距離と近傍の保存、密度など、その精度と意味のさまざまな側面を検査できます。
特定の近傍のコスト、および次元と視覚的パターンの間の相関関係。
私たちは、t-SNE 投影を視覚化するための、一貫性があり、アクセスしやすく、よく統合されたさまざまなビューのコレクションを提案します。
t-viSNE の適用性と使いやすさは、実際のデータセットを使用した仮想的な使用シナリオを通じて実証されます。
最後に、ツールの有効性を評価したユーザー調査の結果を紹介します。
t-SNE を実行すると通常は失われる情報を明らかにすることで、アナリストが t-SNE を使用し、その結果をよりわかりやすくすることをサポートしたいと考えています。

要約(オリジナル)

t-Distributed Stochastic Neighbor Embedding (t-SNE) for the visualization of multidimensional data has proven to be a popular approach, with successful applications in a wide range of domains. Despite their usefulness, t-SNE projections can be hard to interpret or even misleading, which hurts the trustworthiness of the results. Understanding the details of t-SNE itself and the reasons behind specific patterns in its output may be a daunting task, especially for non-experts in dimensionality reduction. In this work, we present t-viSNE, an interactive tool for the visual exploration of t-SNE projections that enables analysts to inspect different aspects of their accuracy and meaning, such as the effects of hyper-parameters, distance and neighborhood preservation, densities and costs of specific neighborhoods, and the correlations between dimensions and visual patterns. We propose a coherent, accessible, and well-integrated collection of different views for the visualization of t-SNE projections. The applicability and usability of t-viSNE are demonstrated through hypothetical usage scenarios with real data sets. Finally, we present the results of a user study where the tool’s effectiveness was evaluated. By bringing to light information that would normally be lost after running t-SNE, we hope to support analysts in using t-SNE and making its results better understandable.

arxiv情報

著者 Angelos Chatzimparmpas,Rafael M. Martins,Andreas Kerren
発行日 2024-04-18 16:03:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, stat.ML パーマリンク