要約
文化の変化を研究するために、テキストの類似性と相違の尺度がますます使用されています。
しかし、実際に変化に関する社会的証拠と一致するのはどれでしょうか?
私たちは、テキストの 3 つの異なる表現 (トピック モデル、文書の埋め込み、単語レベルの複雑さ) を 3 つの異なるコーパス (文学研究、経済学、フィクション) に適用します。
いずれの場合も、引用の多い著者や若い著者の作品は、文章の面で時代の先を行っています。
テキストの 1 つの表現が他の表現よりも優先されるという明確な証拠は見つかりません。
しかし、社会的証拠との整合性は、テキストが文章の上位 4 分の 1 に含まれる場合に最も強くなり、テキストの影響力は、全体を通して高レベルのイノベーションを維持することよりも、最も前向きな瞬間に依存する可能性があることを示唆しています。
要約(オリジナル)
Measures of textual similarity and divergence are increasingly used to study cultural change. But which measures align, in practice, with social evidence about change? We apply three different representations of text (topic models, document embeddings, and word-level perplexity) to three different corpora (literary studies, economics, and fiction). In every case, works by highly-cited authors and younger authors are textually ahead of the curve. We don’t find clear evidence that one representation of text is to be preferred over the others. But alignment with social evidence is strongest when texts are represented through the top quartile of passages, suggesting that a text’s impact may depend more on its most forward-looking moments than on sustaining a high level of innovation throughout.
arxiv情報
著者 | Sarah Griebel,Becca Cohen,Lucian Li,Jaihyun Park,Jiayu Liu,Jana Perkins,Ted Underwood |
発行日 | 2024-11-22 16:56:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google