Tweet Insights: A Visualization Platform to Extract Temporal Insights from Twitter

要約

本論文では、Twitterから得られた大規模な時系列データを、単語埋め込み技術と特殊な微調整を施した言語モデルを用いて後処理したものを紹介する。このデータは過去5年間のもので、n-gram頻度、類似度、センチメント、トピック分布の変化を捉えている。このデータ上に構築されたインターフェースは、センチメントやトピックの時間的関連性などのトレンド・メトリクスの補足情報を含む、意味のシフトを検出し特徴付けるための時間的分析を可能にします。簡単に実験できるようにオンラインデモを公開し、今後の研究のためにコードと基礎となる集計データを共有する。この論文では、私たちのプラットフォームのおかげで解き放たれた3つのケーススタディについても議論し、時間言語分析の可能性を紹介する。

要約(オリジナル)

This paper introduces a large collection of time series data derived from Twitter, postprocessed using word embedding techniques, as well as specialized fine-tuned language models. This data comprises the past five years and captures changes in n-gram frequency, similarity, sentiment and topic distribution. The interface built on top of this data enables temporal analysis for detecting and characterizing shifts in meaning, including complementary information to trending metrics, such as sentiment and topic association over time. We release an online demo for easy experimentation, and we share code and the underlying aggregated data for future work. In this paper, we also discuss three case studies unlocked thanks to our platform, showcasing its potential for temporal linguistic analysis.

arxiv情報

著者 Daniel Loureiro,Kiamehr Rezaee,Talayeh Riahi,Francesco Barbieri,Leonardo Neves,Luis Espinosa Anke,Jose Camacho-Collados
発行日 2023-08-04 05:39:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.SI パーマリンク