OLaLa: Ontology Matching with Large Language Models


オントロジー (より一般的には: ナレッジ グラフ) マッチングは、自然言語の情報が処理すべき最も重要な信号の 1 つである難しいタスクです。
大規模言語モデルの台頭により、この知識をより適切な方法でマッチング パイプラインに組み込むことが可能になりました。
モデルに役立つプロンプトを生成する方法、KG 内の情報をプロンプトでどのように定式化するか、どの大規模言語モデルを選択するか、モデルに既存の対応を提供する方法など、まだ多くの決定を下す必要があります。
この論文では、複数のオープンな大規模言語モデルを使用したゼロショットおよび少数ショット プロンプトをオントロジー アライメント評価イニシアチブ (OAEI) のさまざまなタスクに適用することで、これらの質問を調査するプロトタイプを紹介します。
わずかな例と適切に設計されたプロンプトを使用するだけで、グラウンド トゥルースの大部分を使用する教師ありマッチング システムと同等の結果を達成できることを示します。


Ontology (and more generally: Knowledge Graph) Matching is a challenging task where information in natural language is one of the most important signals to process. With the rise of Large Language Models, it is possible to incorporate this knowledge in a better way into the matching pipeline. A number of decisions still need to be taken, e.g., how to generate a prompt that is useful to the model, how information in the KG can be formulated in prompts, which Large Language Model to choose, how to provide existing correspondences to the model, how to generate candidates, etc. In this paper, we present a prototype that explores these questions by applying zero-shot and few-shot prompting with multiple open Large Language Models to different tasks of the Ontology Alignment Evaluation Initiative (OAEI). We show that with only a handful of examples and a well-designed prompt, it is possible to achieve results that are en par with supervised matching systems which use a much larger portion of the ground truth.


著者 Sven Hertling,Heiko Paulheim
発行日 2023-11-07 09:34:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク