A Grid-based Method for Removing Overlaps of Dimensionality Reduction Scatterplot Layouts

要約

タイトル:次元削減スキャッタープロット・レイアウトのオーバーラップ除去のためのグリッドベースの手法

要約:

– DR(Dimensionality Reduction)スキャッタープロット・レイアウトは、多次元データセットの分析におけるユビキタスな可視化ツールになっています。
– しかしながら、情報を表現するグリフが使用される場合、オーバーラップが発生し、実行中の分析の重要な情報を隠す可能性があります。
– この問題に対処するため、オーバーラップフリーレイアウトや、ポスト処理ストラテジーによるオーバーラップの除去など、さまざまな戦略が考案されてきました。
– ポスト処理技術の結果は良好ですが、最も優れた方法の多くは、スキャッタープロット領域を拡大または歪めるため、グリフのサイズが読み取れない大きさになることがあり、オーバーラップを除去する目的が台無しになる場合があります。
– 本研究は、Distance Grid(DGrid)という新しいポスト処理ストラテジーを紹介し、DRレイアウトからオーバーラップを除去することで、元のレイアウトの特性を忠実に保存し、最小グリフサイズを制限する手法を提供します。
– 複数の異なるメトリックを考慮した広範な比較評価を通じて、DGridが最新のオーバーラップ除去技術を超越していることを示し、大規模なデータセットに対して特に高速な技術の1つであることを示します。
– また、51人の参加者によるユーザー調査でも、DGridが元のスキャッタープロットの視覚的特性と最終結果の美学を維持するためのトップ技術の1つに一貫してランク付けされていることが示されています。

要約(オリジナル)

Dimensionality Reduction (DR) scatterplot layouts have become a ubiquitous visualization tool for analyzing multidimensional datasets. Despite their popularity, such scatterplots suffer from occlusion, especially when informative glyphs are used to represent data instances, potentially obfuscating critical information for the analysis under execution. Different strategies have been devised to address this issue, either producing overlap-free layouts which lack the powerful capabilities of contemporary DR techniques in uncovering interesting data patterns or eliminating overlaps as a post-processing strategy. Despite the good results of post-processing techniques, most of the best methods typically expand or distort the scatterplot area, thus reducing glyphs’ size (sometimes) to unreadable dimensions, defeating the purpose of removing overlaps. This paper presents Distance Grid (DGrid), a novel post-processing strategy to remove overlaps from DR layouts that faithfully preserves the original layout’s characteristics and bounds the minimum glyph sizes. We show that DGrid surpasses the state-of-the-art in overlap removal (through an extensive comparative evaluation considering multiple different metrics) while also being one of the fastest techniques, especially for large datasets. A user study with 51 participants also shows that DGrid is consistently ranked among the top techniques for preserving the original scatterplots’ visual characteristics and the aesthetics of the final results.

arxiv情報

著者 Gladys M. Hilasaca,Wilson E. Marcílio-Jr,Danilo M. Eler,Rafael M. Martins,Fernando V. Paulovich
発行日 2023-05-09 01:58:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク