Annotating Compositionality Scores for Irish Noun Compounds is Hard Work

要約

名詞化合物は、慣用度と解釈の変動を考えると、NLPアプリケーションの困難な構造となります。
この論文では、専門家のアノテーターによってさまざまなドメインのアイルランドのテキストで特定された化合物名詞の分析を提示し、重要な特徴としての構成性に焦点を当て、ドメインの特異性、および評価を与えるアノテーターの親しみやすさと自信を示します。
私たちの調査結果とその後の議論は、これらの構造がアイルランド語でどのように登場するか、そしてそれらが英語の名詞化合物とは別に扱われる方法をより深く理解することに貢献します。

要約(オリジナル)

Noun compounds constitute a challenging construction for NLP applications, given their variability in idiomaticity and interpretation. In this paper, we present an analysis of compound nouns identified in Irish text of varied domains by expert annotators, focusing on compositionality as a key feature, but also domain specificity, as well as familiarity and confidence of the annotator giving the ratings. Our findings and the discussion that ensued contributes towards a greater understanding of how these constructions appear in Irish language, and how they might be treated separately from English noun compounds.

arxiv情報

著者 Abigail Walsh,Teresa Clifford,Emma Daly,Jane Dunne,Brian Davis,Gearóid Ó Cleircín
発行日 2025-02-14 10:32:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク