Validating ChatGPT Facts through RDF Knowledge Graphs and Sentence Similarity


ChatGPT は、根拠のない詳細な応答や、人気のある人物、イベント、場所であっても誤った事実を提供するため、この論文では、RDF で ChatGPT の応答を取得し、1 つ以上の RDF ナレッジ グラフを使用して ChatGPT の事実を検証する新しいパイプラインを紹介します。
この目的を達成するために、DBpedia と LODsyndesis (多くのドメインの 400 の RDF KG からの 20 億のトリプルを含む集約されたナレッジ グラフ) と短文の埋め込みを活用し、より関連性の高いトリプルをその来歴と
これにより、ChatGPT 応答の検証と、正当な理由と来歴による応答の強化が可能になります。
このサービス (このようなサービス全般) を評価するために、2,000 の ChatGPT ファクトを含む評価ベンチマークを作成します。
具体的には、有名なギリシャ人に関する 1,000 件の事実、ギリシャの人気の場所に関する 500 件の事実、ギリシャに関連するイベントに関する 500 件の事実です。
ファクトは手動でラベル付けされました (ChatGPT ファクトの約 73% が正しく、ファクトの 27% が誤っていました)。
ベンチマーク全体について、ChatGPT の正しい事実の 85.3% を検証し、ChatGPT の誤った事実の 58% について正しい答えを見つけることができました。


Since ChatGPT offers detailed responses without justifications, and erroneous facts even for popular persons, events and places, in this paper we present a novel pipeline that retrieves the response of ChatGPT in RDF and tries to validate the ChatGPT facts using one or more RDF Knowledge Graphs (KGs). To this end we leverage DBpedia and LODsyndesis (an aggregated Knowledge Graph that contains 2 billion triples from 400 RDF KGs of many domains) and short sentence embeddings, and introduce an algorithm that returns the more relevant triple(s) accompanied by their provenance and a confidence score. This enables the validation of ChatGPT responses and their enrichment with justifications and provenance. To evaluate this service (such services in general), we create an evaluation benchmark that includes 2,000 ChatGPT facts; specifically 1,000 facts for famous Greek Persons, 500 facts for popular Greek Places, and 500 facts for Events related to Greece. The facts were manually labelled (approximately 73% of ChatGPT facts were correct and 27% of facts were erroneous). The results are promising; indicatively for the whole benchmark, we managed to verify the 85.3% of the correct facts of ChatGPT and to find the correct answer for the 58% of the erroneous ChatGPT facts.


著者 Michalis Mountantonakis,Yannis Tzitzikas
発行日 2023-11-17 13:24:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.DB パーマリンク