要約
信頼性と保全性(RAM)の領域で、大規模で複雑な技術文書から関連する構造化された知識を抽出することは、労力がかかり、エラーが発生しやすい。我々の研究は、オントロジー抽出とナレッジグラフ(KG)生成のための本物のパイプラインであるOntoKGenを提示することによって、この課題に対処しています。OntoKGenは、適応的な反復思考(CoT)アルゴリズムによってガイドされる対話的なユーザーインターフェースを通じて、大規模言語モデル(LLM)を活用し、オントロジー抽出プロセス、ひいてはKG生成がユーザー固有の要件に合致するようにする。KG生成は、確認されたオントロジーに基づく明確で構造化された経路をたどりますが、オントロジーは本質的にユーザーの嗜好に基づくため、普遍的に正しいオントロジーは存在しません。OntoKGen はベストプラクティスに基づいたオントロジーを推奨し、ユーザーの労力を最小限に抑え、見落とされていたかもしれない貴重な洞察を提供します。確認されたオントロジーに基づいてKGを生成したOntoKGenは、Neo4jのようなスキームレスで非リレーショナルなデータベースへのシームレスな統合を可能にする。この統合により、多様な非構造化ソースからの知識の柔軟な保存と検索が可能になり、高度なクエリ、分析、意思決定が容易になる。さらに、生成されたKGは、将来RAG(Retrieval Augmented Generation)システムに統合するための強固な基盤として機能し、ドメイン固有のインテリジェント・アプリケーションを開発するための強化された機能を提供する。
要約(オリジナル)
Extracting relevant and structured knowledge from large, complex technical documents within the Reliability and Maintainability (RAM) domain is labor-intensive and prone to errors. Our work addresses this challenge by presenting OntoKGen, a genuine pipeline for ontology extraction and Knowledge Graph (KG) generation. OntoKGen leverages Large Language Models (LLMs) through an interactive user interface guided by our adaptive iterative Chain of Thought (CoT) algorithm to ensure that the ontology extraction process and, thus, KG generation align with user-specific requirements. Although KG generation follows a clear, structured path based on the confirmed ontology, there is no universally correct ontology as it is inherently based on the user’s preferences. OntoKGen recommends an ontology grounded in best practices, minimizing user effort and providing valuable insights that may have been overlooked, all while giving the user complete control over the final ontology. Having generated the KG based on the confirmed ontology, OntoKGen enables seamless integration into schemeless, non-relational databases like Neo4j. This integration allows for flexible storage and retrieval of knowledge from diverse, unstructured sources, facilitating advanced querying, analysis, and decision-making. Moreover, the generated KG serves as a robust foundation for future integration into Retrieval Augmented Generation (RAG) systems, offering enhanced capabilities for developing domain-specific intelligent applications.
arxiv情報
著者 | Mohammad Sadeq Abolhasani,Rong Pan |
発行日 | 2024-12-03 17:49:02+00:00 |
arxivサイト | arxiv_id(pdf) |