A UD Treebank for Bohairic Coptic

要約

他のコプト方言、特にSahidic、Bohairic Coptic、Pre-Mamlukの主要なコプト方言、後期ビザンチンエジプト、およびコプト教会の現代言語であるSahidic、Bohairic Copticのデジタルリソースの最近の進歩にもかかわらず、非常に資料不足のままです。
このペーパーでは、ボハエリックコプトの最初の構文的に注釈されたコーパスを紹介および評価し、聖書のテキスト、聖人の生活、キリスト教の禁欲的な執筆を含むさまざまな作品のデータをサンプリングします。
また、言語の古典的な方言であるSahidic Copticの既存のUDツリーバンクと比較して、観察する主な違いのいくつかを探り、共同および対称性の解析実験を行い、より頻繁に研究されているSahidicとの関連性があるが異なる多様性としてのユニークな性質を明らかにします。

要約(オリジナル)

Despite recent advances in digital resources for other Coptic dialects, especially Sahidic, Bohairic Coptic, the main Coptic dialect for pre-Mamluk, late Byzantine Egypt, and the contemporary language of the Coptic Church, remains critically under-resourced. This paper presents and evaluates the first syntactically annotated corpus of Bohairic Coptic, sampling data from a range of works, including Biblical text, saints’ lives and Christian ascetic writing. We also explore some of the main differences we observe compared to the existing UD treebank of Sahidic Coptic, the classical dialect of the language, and conduct joint and cross-dialect parsing experiments, revealing the unique nature of Bohairic as a related, but distinct variety from the more often studied Sahidic.

arxiv情報

著者 Amir Zeldes,Nina Speransky,Nicholas Wagner,Caroline T. Schroeder
発行日 2025-04-25 14:33:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク