Large language models as oracles for instantiating ontologies with domain-specific knowledge

要約

背景。
インテリジェント システムにセマンティック データを提供するには、通常、ドメイン固有の知識を使用してオントロジーを設計し、インスタンス化する必要があります。
特に初期段階では、これらのアクティビティは通常、人間の専門家によっておそらく自身の経験を活用して手動で実行されます。
したがって、結果として得られるプロセスは時間がかかり、エラーが発生しやすく、オントロジー設計者の個人的な背景によって偏ることがよくあります。
客観的。
この問題を軽減するために、大規模言語モデル (LLM) をオラクルとして活用し、ドメイン固有の知識を備えたオントロジーを自動的にインスタンス化する、新しいドメイン独立アプローチを提案します。
方法。
(i) 相互に関連するクラスとプロパティで構成される初期スキーマ、および (ii) 一連のクエリ テンプレートから開始して、私たちのメソッドは LLM に複数回クエリを実行し、その応答からクラスとプロパティの両方のインスタンスを生成します。
したがって、オントロジーには、初期スキーマに準拠したドメイン固有の知識が自動的に入力されます。
その結果、オントロジーはマニホールド インスタンスで迅速かつ自動的に強化され、専門家は自身のニーズや専門知識に応じて、これらのインスタンスを保持、調整、破棄、または補完することを検討できます。
貢献。
私たちは一般的な方法でメソッドを形式化し、具体的なケーススタディだけでなく、さまざまな LLM 上でインスタンス化します。
私たちは、食事とその関係性の分類から始めて、食事とその成分のオントロジーがゼロから半自動的にインスタンス化される、栄養学領域に根ざした実験を報告します。
そこで、生成されたオントロジーの品質を分析し、さまざまな LLM を利用して取得されたオントロジーを比較します。
最後に、提案された手法の SWOT 分析を示します。

要約(オリジナル)

Background. Endowing intelligent systems with semantic data commonly requires designing and instantiating ontologies with domain-specific knowledge. Especially in the early phases, those activities are typically performed manually by human experts possibly leveraging on their own experience. The resulting process is therefore time-consuming, error-prone, and often biased by the personal background of the ontology designer. Objective. To mitigate that issue, we propose a novel domain-independent approach to automatically instantiate ontologies with domain-specific knowledge, by leveraging on large language models (LLMs) as oracles. Method. Starting from (i) an initial schema composed by inter-related classes andproperties and (ii) a set of query templates, our method queries the LLM multi- ple times, and generates instances for both classes and properties from its replies. Thus, the ontology is automatically filled with domain-specific knowledge, compliant to the initial schema. As a result, the ontology is quickly and automatically enriched with manifold instances, which experts may consider to keep, adjust, discard, or complement according to their own needs and expertise. Contribution. We formalise our method in general way and instantiate it over various LLMs, as well as on a concrete case study. We report experiments rooted in the nutritional domain where an ontology of food meals and their ingredients is semi-automatically instantiated from scratch, starting from a categorisation of meals and their relationships. There, we analyse the quality of the generated ontologies and compare ontologies attained by exploiting different LLMs. Finally, we provide a SWOT analysis of the proposed method.

arxiv情報

著者 Giovanni Ciatto,Andrea Agiollo,Matteo Magnini,Andrea Omicini
発行日 2024-04-05 14:04:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG, cs.LO パーマリンク