要約
この論文では、自然言語処理 (NLP) タスク、特に品詞 (POS) のタグ付けにおいて名詞形容詞 (NA) によってもたらされる課題について検討します。
私たちは、NA を別個の POS タグ「JN」として扱うことを提案し、POS タグ付け、BIO チャンキング、および共参照解決に対するその影響を調査します。
私たちの研究は、NA を再分類すると、NLP における構文分析と構造理解の精度が向上する可能性があることを示しています。
隠れマルコフ モデル (HMM)、最大エントロピー (MaxEnt) モデル、および Spacy を使用した実験結果を示し、このアプローチの実現可能性と潜在的な利点を示します。
さらに、タグなしテキスト内の NA を識別するために bert モデルをトレーニングしました。
要約(オリジナル)
This paper explores the challenges posed by nominal adjectives (NAs) in natural language processing (NLP) tasks, particularly in part-of-speech (POS) tagging. We propose treating NAs as a distinct POS tag, ‘JN,’ and investigate its impact on POS tagging, BIO chunking, and coreference resolution. Our study shows that reclassifying NAs can improve the accuracy of syntactic analysis and structural understanding in NLP. We present experimental results using Hidden Markov Models (HMMs), Maximum Entropy (MaxEnt) models, and Spacy, demonstrating the feasibility and potential benefits of this approach. Additionally we trained a bert model to identify the NA in untagged text.
arxiv情報
著者 | Lemeng Qi,Yang Han,Zhuotong Xie |
発行日 | 2024-09-26 10:01:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google