S+t-SNE — Bringing Dimensionality Reduction to Data Streams

要約

無限のデータ ストリームを処理するように設計された t-SNE アルゴリズムを適応させた S+t-SNE を紹介します。
S+t-SNE の背後にある中心的なアイデアは、新しいデータが到着するたびに t-SNE 埋め込みを段階的に更新し、ストリーミング シナリオを処理するためのスケーラビリティと適応性を確保することです。
各ステップで最も重要なポイントを選択することで、アルゴリズムは有益な視覚化を維持しながらスケーラビリティを確保します。
ドリフト管理にブラインド方式を採用することで、アルゴリズムは埋め込みスペースを調整し、進化するデータダイナミクスの視覚化を容易にします。
私たちの実験的評価は、S+t-SNE の有効性と効率性を実証するとともに、ストリーミング シナリオでパターンをキャプチャする能力を強調しています。
私たちのアプローチが研究者や実務家に高次元データを理解して解釈するためのリアルタイム ツールを提供することを願っています。

要約(オリジナル)

We present S+t-SNE, an adaptation of the t-SNE algorithm designed to handle infinite data streams. The core idea behind S+t-SNE is to update the t-SNE embedding incrementally as new data arrives, ensuring scalability and adaptability to handle streaming scenarios. By selecting the most important points at each step, the algorithm ensures scalability while keeping informative visualisations. By employing a blind method for drift management, the algorithm adjusts the embedding space, which facilitates the visualisation of evolving data dynamics. Our experimental evaluations demonstrate the effectiveness and efficiency of S+t-SNE, whilst highlighting its ability to capture patterns in a streaming scenario. We hope our approach offers researchers and practitioners a real-time tool for understanding and interpreting high-dimensional data.

arxiv情報

著者 Pedro C. Vieira,João P. Montrezol,João T. Vieira,João Gama
発行日 2025-01-21 15:52:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク