Persian Pronoun Resolution: Leveraging Neural Networks and Language Models

要約

共参照の解決は、同じ実体を参照するテキスト実体を識別するために重要ですが、代名詞の解決、特に代名詞の先行詞の識別において課題に直面しています。
既存の方法では、代名詞の解決をメンション検出とは別のタスクとして扱うことが多く、貴重な情報が失われる可能性があります。
この研究では、ParsBERT のような事前トレーニング済みの Transformer モデルを活用して、ペルシア語の代名詞を解決するための最初のエンドツーエンドのニューラル ネットワーク システムを提案します。
私たちのシステムは、言及検出と先行詞リンクの両方を共同で最適化し、メーア コーパスにおける以前の最先端システム (ルールベースの統計的手法に依存していた) と比較して 3.37 F1 スコアの向上を達成しました。
この大幅な改善は、ニューラル ネットワークと言語モデルを組み合わせることの有効性を示しており、ペルシア語の代名詞の解決が大幅に進歩する可能性があり、この未開発の領域におけるさらなる研究への道が開かれる可能性があります。

要約(オリジナル)

Coreference resolution, critical for identifying textual entities referencing the same entity, faces challenges in pronoun resolution, particularly identifying pronoun antecedents. Existing methods often treat pronoun resolution as a separate task from mention detection, potentially missing valuable information. This study proposes the first end-to-end neural network system for Persian pronoun resolution, leveraging pre-trained Transformer models like ParsBERT. Our system jointly optimizes both mention detection and antecedent linking, achieving a 3.37 F1 score improvement over the previous state-of-the-art system (which relied on rule-based and statistical methods) on the Mehr corpus. This significant improvement demonstrates the effectiveness of combining neural networks with linguistic models, potentially marking a significant advancement in Persian pronoun resolution and paving the way for further research in this under-explored area.

arxiv情報

著者 Hassan Haji Mohammadi,Alireza Talebpour,Ahmad Mahmoudi Aznaveh,Samaneh Yazdani
発行日 2024-05-17 11:56:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク