Towards Enhancing Linked Data Retrieval in Conversational UIs using Large Language Models

要約

最近、さまざまなドメインで大規模言語モデル (LLM) が広く採用されているにもかかわらず、リンクト データ (LD) およびリソース記述フレームワーク (RDF) トリプルストアの抽出と探索において情報システムを強化する LLM の可能性は、広く検討されていません。
このペーパーでは、既存のシステム内での LLM の統合について検討し、モデルの再トレーニングを必要とせずに、より正確な SPARQL クエリを生成することによる、会話型ユーザー インターフェイス (UI) とそのデータ抽出機能の強化を強調します。
通常、会話型 UI モデルでは、新しいデータセットや更新の導入に伴う再トレーニングが必要となり、汎用抽出ツールとしての機能が制限されます。
私たちのアプローチは、LLM を会話型 UI ワークフローに組み込むことでこの制限に対処し、ユーザー クエリを効果的に理解して処理する能力を大幅に強化します。
LLM の高度な自然言語理解機能を活用することで、私たちの方法は、従来のチャットボットを使用する Web システム内での RDF エンティティ抽出を改善します。
この統合により、RDF データセットや Linked Open Data (LOD) エンドポイントで頻繁に発生する複雑なクエリ パターンを処理するために重要な、より微妙でコンテキストを認識した対話モデルが促進されます。
この方法論の評価では、システムの表現力とユーザーのクエリに対する応答の精度が大幅に向上していることが示されており、この分野における将来の研究の有望な方向性を示しています。
この調査は、既存の情報システムを強化する際の LLM の多用途性を強調するだけでなく、Web 情報システムのより専門化されたドメイン内での潜在的なアプリケーションをさらに探索するための準備も整えます。

要約(オリジナル)

Despite the recent broad adoption of Large Language Models (LLMs) across various domains, their potential for enriching information systems in extracting and exploring Linked Data (LD) and Resource Description Framework (RDF) triplestores has not been extensively explored. This paper examines the integration of LLMs within existing systems, emphasising the enhancement of conversational user interfaces (UIs) and their capabilities for data extraction by producing more accurate SPARQL queries without the requirement for model retraining. Typically, conversational UI models necessitate retraining with the introduction of new datasets or updates, limiting their functionality as general-purpose extraction tools. Our approach addresses this limitation by incorporating LLMs into the conversational UI workflow, significantly enhancing their ability to comprehend and process user queries effectively. By leveraging the advanced natural language understanding capabilities of LLMs, our method improves RDF entity extraction within web systems employing conventional chatbots. This integration facilitates a more nuanced and context-aware interaction model, critical for handling the complex query patterns often encountered in RDF datasets and Linked Open Data (LOD) endpoints. The evaluation of this methodology shows a marked enhancement in system expressivity and the accuracy of responses to user queries, indicating a promising direction for future research in this area. This investigation not only underscores the versatility of LLMs in enhancing existing information systems but also sets the stage for further explorations into their potential applications within more specialised domains of web information systems.

arxiv情報

著者 Omar Mussa,Omer Rana,Benoît Goossens,Pablo Orozco-Terwengel,Charith Perera
発行日 2024-09-24 16:31:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク