Construction of a Syntactic Analysis Map for Yi Shui School through Text Mining and Natural Language Processing Research

要約

エンティティと関係の抽出は、ナレッジ グラフの構築、質問応答システムの設計、意味分析などの自然言語処理タスクにおいて重要なコンポーネントです。
沂水派の伝統的な中国医学 (TCM) の情報のほとんどは、構造化されていない古典的な漢文の形式で保存されています。
中医学テキストの重要な情報の抽出は、中医学の学術学校のマイニングと研究において重要な役割を果たします。
人工知能手法を使用してこれらの問題を効率的に解決するために、この研究では、自然言語処理技術の枠組みの下で条件付きランダムフィールドに基づいて単語分割および実体関係抽出モデルを構築し、伝統的な漢方薬テキストの実体関係を識別および抽出します。
は、TF-IDF 情報検索とデータマイニングの共通の重み付け技術を使用して、さまざまな古代書籍に含まれる重要な主要な実体情報を抽出します。
ニューラル ネットワークに基づく依存構文パーサーは、古書の各記事のエンティティ間の文法関係を分析するために使用され、ツリー構造の視覚化として表現されます。これは、沂水学派のナレッジ グラフと知識グラフの次の構築の基礎を築きます。
中医学校の研究を実行するための人工知能手法の使用。

要約(オリジナル)

Entity and relationship extraction is a crucial component in natural language processing tasks such as knowledge graph construction, question answering system design, and semantic analysis. Most of the information of the Yishui school of traditional Chinese Medicine (TCM) is stored in the form of unstructured classical Chinese text. The key information extraction of TCM texts plays an important role in mining and studying the academic schools of TCM. In order to solve these problems efficiently using artificial intelligence methods, this study constructs a word segmentation and entity relationship extraction model based on conditional random fields under the framework of natural language processing technology to identify and extract the entity relationship of traditional Chinese medicine texts, and uses the common weighting technology of TF-IDF information retrieval and data mining to extract important key entity information in different ancient books. The dependency syntactic parser based on neural network is used to analyze the grammatical relationship between entities in each ancient book article, and it is represented as a tree structure visualization, which lays the foundation for the next construction of the knowledge graph of Yishui school and the use of artificial intelligence methods to carry out the research of TCM academic schools.

arxiv情報

著者 Hanqing Zhao,Yuehan Li
発行日 2024-02-16 14:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク