要約
現代標準アラビア語 (MSA) 名目は、これまで一貫して対処されていなかった多くの形態学的および語彙モデリングの課題を提示しています。
この論文は、そのような課題の空間を定義し、最近提案された形態学的フレームワークを活用して、MSA 公称の包括的で拡張可能なモデルを構築することを試みます。
私たちのモデル設計は、名目上の複雑な形態戦術とそのパラダイム的不規則性に対処します。
私たちの実装は、一般的に使用されている MSA 形態素解析器および生成器と比較して、精度と一貫性が向上していることを示しています。
私たちはモデルを公開しています。
要約(オリジナル)
Modern Standard Arabic (MSA) nominals present many morphological and lexical modeling challenges that have not been consistently addressed previously. This paper attempts to define the space of such challenges, and leverage a recently proposed morphological framework to build a comprehensive and extensible model for MSA nominals. Our model design addresses the nominals’ intricate morphotactics, as well as their paradigmatic irregularities. Our implementation showcases enhanced accuracy and consistency compared to a commonly used MSA morphological analyzer and generator. We make our models publicly available.
arxiv情報
| 著者 | Christian Khairallah,Reham Marzouk,Salam Khalifa,Mayar Nassar,Nizar Habash |
| 発行日 | 2024-02-01 07:05:45+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google