Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph

要約

提案された研究は、ユーザーがオーストラリア国立大学 (ANU) のコンピューター サイエンス (CS) 研究者によって作成された研究成果に関する包括的な情報を取得できるようにする革新的なセマンティック クエリ処理システムを開発することを目的としています。
このシステムは、Large Language Model (LLM) を、ANU Scholarly Knowledge Graph (ASKG) と統合します。これは、ANU で作成された CS 分野のすべての研究関連成果物の構造化リポジトリです。
各成果物とその部分は、ナレッジ グラフ (KG) に保存されたテキスト ノードとして表されます。
きめ細かい詳細を捕捉できないことが多い、従来の学術的な KG 構築および利用方法の限界に対処するために、包括的な文書表現のためのディープ ドキュメント モデル (DDM) と KG 拡張クエリ処理 (KGQP) を統合する新しいフレームワークを提案します。
) 複雑なクエリ処理を最適化します。
DDM を使用すると、学術論文内の階層構造と意味関係をきめ細かく表現できるようになり、KGQP は KG 構造を活用して、LLM によるクエリの精度と効率を向上させることができます。
ASKG と LLM を組み合わせることで、私たちのアプローチは知識の活用と自然言語理解能力を強化します。
提案されたシステムは、自動 LLM-SPARQL 融合を採用して、関連するファクトとテキスト ノードを ASKG から取得します。
初期実験では、精度取得とクエリ効率の点で、私たちのフレームワークがベースライン手法よりも優れていることが実証されました。
学術研究シナリオにおけるフレームワークの実際的な応用例を紹介し、学術知識の管理と発見に革命をもたらす可能性を強調します。
この取り組みにより、研究者は文書から知識をより効果的に取得して活用できるようになり、LLM との正確で信頼性の高い対話を開発するための基盤が提供されます。

要約(オリジナル)

The proposed research aims to develop an innovative semantic query processing system that enables users to obtain comprehensive information about research works produced by Computer Science (CS) researchers at the Australian National University (ANU). The system integrates Large Language Models (LLMs) with the ANU Scholarly Knowledge Graph (ASKG), a structured repository of all research-related artifacts produced at ANU in the CS field. Each artifact and its parts are represented as textual nodes stored in a Knowledge Graph (KG). To address the limitations of traditional scholarly KG construction and utilization methods, which often fail to capture fine-grained details, we propose a novel framework that integrates the Deep Document Model (DDM) for comprehensive document representation and the KG-enhanced Query Processing (KGQP) for optimized complex query handling. DDM enables a fine-grained representation of the hierarchical structure and semantic relationships within academic papers, while KGQP leverages the KG structure to improve query accuracy and efficiency with LLMs. By combining the ASKG with LLMs, our approach enhances knowledge utilization and natural language understanding capabilities. The proposed system employs an automatic LLM-SPARQL fusion to retrieve relevant facts and textual nodes from the ASKG. Initial experiments demonstrate that our framework is superior to baseline methods in terms of accuracy retrieval and query efficiency. We showcase the practical application of our framework in academic research scenarios, highlighting its potential to revolutionize scholarly knowledge management and discovery. This work empowers researchers to acquire and utilize knowledge from documents more effectively and provides a foundation for developing precise and reliable interactions with LLMs.

arxiv情報

著者 Runsong Jia,Bowen Zhang,Sergio J. Rodríguez Méndez,Pouya G. Omran
発行日 2024-05-24 09:19:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, H.3.3 パーマリンク