要約
動的トピック モデリングは、時間の経過に伴う潜在トピックの発展と変化を発見するのに役立ちます。
ただし、現在の方法論は、文書と単語の表現を分離するアルゴリズムに依存しています。
これにより、単語の使用法や文書の変化を時間的なコンテキストで直接分析できる、意味のある埋め込みスペースの作成が妨げられます。
この論文では、コンパスに合わせた時間的な Word2Vec 手法を動的トピック モデリングに拡張することを提案します。
このような方法により、動的なトピックで単語とドキュメントの埋め込みを時間の経過とともに直接比較できます。
これにより、ドキュメントのコンテキスト内の一時的な単語の埋め込みをトピックの視覚化に組み込んだ視覚化の作成が可能になります。
現在の最先端技術と比較した実験では、私たちが提案する方法は、さまざまなサイズの時間データセットにわたるトピックの関連性と多様性において全体的な競合パフォーマンスを実証します。
同時に、グローバルなトピックの進化によって提供される洞察を維持しながら、時間的な単語の埋め込みに焦点を当てた洞察力に富んだ視覚化を提供し、トピックが時間の経過とともにどのように進化するかについての理解を進めます。
要約(オリジナル)
Dynamic topic modeling is useful at discovering the development and change in latent topics over time. However, present methodology relies on algorithms that separate document and word representations. This prevents the creation of a meaningful embedding space where changes in word usage and documents can be directly analyzed in a temporal context. This paper proposes an expansion of the compass-aligned temporal Word2Vec methodology into dynamic topic modeling. Such a method allows for the direct comparison of word and document embeddings across time in dynamic topics. This enables the creation of visualizations that incorporate temporal word embeddings within the context of documents into topic visualizations. In experiments against the current state-of-the-art, our proposed method demonstrates overall competitive performance in topic relevancy and diversity across temporal datasets of varying size. Simultaneously, it provides insightful visualizations focused on temporal word embeddings while maintaining the insights provided by global topic evolution, advancing our understanding of how topics evolve over time.
arxiv情報
著者 | Daniel Palamarchuk,Lemara Williams,Brian Mayer,Thomas Danielson,Rebecca Faust,Larry Deschaine,Chris North |
発行日 | 2024-09-18 15:48:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google