Detecting text level intellectual influence with knowledge graph embeddings

要約

はじめに: アイデアの広がりと影響力の存在を追跡することは、知的歴史から文化分析、計算社会科学、科学に至るまで、幅広い分野にわたって特に重要な問題です。
方法: オープンソースのジャーナル記事のコーパスを収集し、Gemini LLM を使用してナレッジ グラフ表現を生成し、以前に公開された方法と新しいグラフ ニューラル ネットワーク ベースの埋め込みモデルを使用して、サンプリングされた記事のペア間の引用の存在を予測しようとします。
結果: ナレッジ グラフ埋め込み手法が、引用の有無にかかわらず記事のペアを区別する点で優れていることを示します。
一度トレーニングすると、効率的に実行され、個々の研究者のニーズに合わせて特定のコーパスを微調整できます。
結論: この実験は、ナレッジ グラフにエンコードされた関係、特に特定の関係によってまとめられた概念の種類が、知的影響を明らかにできる情報をエンコードできることを示しています。
これは、潜在的な構造を理解するためにドキュメントレベルのナレッジグラフを分析するさらなる作業により、貴重な洞察が得られる可能性があることを示唆しています。

要約(オリジナル)

Introduction: Tracing the spread of ideas and the presence of influence is a question of special importance across a wide range of disciplines, ranging from intellectual history to cultural analytics, computational social science, and the science of science. Method: We collect a corpus of open source journal articles, generate Knowledge Graph representations using the Gemini LLM, and attempt to predict the existence of citations between sampled pairs of articles using previously published methods and a novel Graph Neural Network based embedding model. Results: We demonstrate that our knowledge graph embedding method is superior at distinguishing pairs of articles with and without citation. Once trained, it runs efficiently and can be fine-tuned on specific corpora to suit individual researcher needs. Conclusion(s): This experiment demonstrates that the relationships encoded in a knowledge graph, especially the types of concepts brought together by specific relations can encode information capable of revealing intellectual influence. This suggests that further work in analyzing document level knowledge graphs to understand latent structures could provide valuable insights.

arxiv情報

著者 Lucian Li,Eryclis Silva
発行日 2024-10-31 15:21:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク