Construction of a Syntactic Analysis Map for Yi Shui School through Text Mining and Natural Language Processing Research


エンティティと関係の抽出は、ナレッジ グラフの構築、質問応答システムの設計、意味分析などの自然言語処理タスクにおいて重要なコンポーネントです。
沂水派の伝統的な中国医学 (TCM) の情報のほとんどは、構造化されていない古典的な漢文の形式で保存されています。
は、TF-IDF 情報検索とデータマイニングの共通の重み付け技術を使用して、さまざまな古代書籍に含まれる重要な主要な実体情報を抽出します。
ニューラル ネットワークに基づく依存構文パーサーは、古書の各記事のエンティティ間の文法関係を分析するために使用され、ツリー構造の視覚化として表現されます。これは、沂水学派のナレッジ グラフと知識グラフの次の構築の基礎を築きます。


Entity and relationship extraction is a crucial component in natural language processing tasks such as knowledge graph construction, question answering system design, and semantic analysis. Most of the information of the Yishui school of traditional Chinese Medicine (TCM) is stored in the form of unstructured classical Chinese text. The key information extraction of TCM texts plays an important role in mining and studying the academic schools of TCM. In order to solve these problems efficiently using artificial intelligence methods, this study constructs a word segmentation and entity relationship extraction model based on conditional random fields under the framework of natural language processing technology to identify and extract the entity relationship of traditional Chinese medicine texts, and uses the common weighting technology of TF-IDF information retrieval and data mining to extract important key entity information in different ancient books. The dependency syntactic parser based on neural network is used to analyze the grammatical relationship between entities in each ancient book article, and it is represented as a tree structure visualization, which lays the foundation for the next construction of the knowledge graph of Yishui school and the use of artificial intelligence methods to carry out the research of TCM academic schools.


著者 Hanqing Zhao,Yuehan Li
発行日 2024-02-16 14:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク