WizMap: Scalable Interactive Visualization for Exploring Large Machine Learning Embeddings

要約

機械学習モデルは多くの場合、トレーニング データのドメイン セマンティクスをキャプチャする潜在的な埋め込み表現を学習します。
これらの埋め込み表現は、トレーニングされたモデルの解釈、新しいモデルの構築、新しいデータセットの分析に役立ちます。
ただし、エンベディングの不透明性、高次元性、最新のデータセットのサイズが大きいため、エンベディングの解釈と使用は困難な場合があります。
これらの課題に取り組むために、研究者や実務者が大規模な埋め込みを簡単に探索できるようにする対話型の視覚化ツールである WizMap を紹介します。
新しい多重解像度埋め込み要約方法と使い慣れた地図のようなインタラクション デザインを備えた WizMap を使用すると、ユーザーは埋め込み空間を簡単にナビゲートして解釈できます。
WebGL や Web Workers などの最新の Web テクノロジを活用する WizMap は、専用のバックエンド サーバーを必要とせずに、ユーザーの Web ブラウザや計算ノートブックに直接数百万の埋め込みポイントに拡張できます。
WizMap はオープンソースであり、公開デモ リンク https://poloclub.github.io/wizmap から入手できます。

要約(オリジナル)

Machine learning models often learn latent embedding representations that capture the domain semantics of their training data. These embedding representations are valuable for interpreting trained models, building new models, and analyzing new datasets. However, interpreting and using embeddings can be challenging due to their opaqueness, high dimensionality, and the large size of modern datasets. To tackle these challenges, we present WizMap, an interactive visualization tool to help researchers and practitioners easily explore large embeddings. With a novel multi-resolution embedding summarization method and a familiar map-like interaction design, WizMap enables users to navigate and interpret embedding spaces with ease. Leveraging modern web technologies such as WebGL and Web Workers, WizMap scales to millions of embedding points directly in users’ web browsers and computational notebooks without the need for dedicated backend servers. WizMap is open-source and available at the following public demo link: https://poloclub.github.io/wizmap.

arxiv情報

著者 Zijie J. Wang,Fred Hohman,Duen Horng Chau
発行日 2023-06-15 17:58:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV, cs.HC, cs.LG パーマリンク