Automated Construction of a Knowledge Graph of Nuclear Fusion Energy for Effective Elicitation and Retrieval of Information

要約

このドキュメントでは、大規模なドキュメントコーパスからドメイン固有の知識を構築および表現するための知識グラフの自動構築に対するマルチステップアプローチについて説明します。
私たちの方法を適用して、核融合エネルギーの最初の知識グラフを構築します。これは、広大な範囲と不均一性を特徴とする高度に専門化されたフィールドです。
これは、自動指定されたエンティティ認識やエンティティ解像度など、パイプラインの主要な機能をテストするための理想的なベンチマークです。
事前に訓練された大規模な言語モデルを使用してこれらの課題に対処する方法を示し、人間が生成した自然言語を特徴付けるZIPFの法律に対するパフォーマンスを評価します。
さらに、大規模な言語モデルとマルチプロムプトアプローチを組み合わせたナレッジグラフ検索の高性化システムを開発します。
このシステムは、相互接続されたエンティティ全体で推論を必要とする複雑なマルチホップ質問を含む、自然言語クエリに対する文脈的に関連する回答を提供します。

要約(オリジナル)

In this document, we discuss a multi-step approach to automated construction of a knowledge graph, for structuring and representing domain-specific knowledge from large document corpora. We apply our method to build the first knowledge graph of nuclear fusion energy, a highly specialized field characterized by vast scope and heterogeneity. This is an ideal benchmark to test the key features of our pipeline, including automatic named entity recognition and entity resolution. We show how pre-trained large language models can be used to address these challenges and we evaluate their performance against Zipf’s law, which characterizes human-generated natural language. Additionally, we develop a knowledge-graph retrieval-augmented generation system that combines large language models with a multi-prompt approach. This system provides contextually relevant answers to natural-language queries, including complex multi-hop questions that require reasoning across interconnected entities.

arxiv情報

著者 A. Loreti,K. Chen,R. George,R. Firth,A. Agnello,S. Tanaka
発行日 2025-04-10 13:29:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク