Meta4XNLI: A Crosslingual Parallel Corpus for Metaphor Detection and Interpretation

要約

比喩は、認識されないこともありますが、私たちの日常言語に遍在しています。
したがって、言語モデルがこの種の比喩的な言語の根底にある意味を把握できることが重要です。
この研究では、メタファーの検出と解釈のタスク用の新しい並列データセットである Meta4XNLI を紹介します。このデータセットには、スペイン語と英語の両方でメタファーの注釈が含まれています。
私たちは、提案したコーパスを活用して、一連の単一言語および複数言語の実験を通じて、言語モデルのメタファー識別および理解能力を調査します。
これらの非リテラル式がモデルのパフォーマンスにどのような影響を与えるかを理解するために、結果を調べてエラー分析を実行します。
さらに、並列データは、これらの言語間のメタファーの伝達可能性や、多言語の注釈付きリソースの開発に対する翻訳の影響を調査する多くの潜在的な機会を提供します。

要約(オリジナル)

Metaphors, although occasionally unperceived, are ubiquitous in our everyday language. Thus, it is crucial for Language Models to be able to grasp the underlying meaning of this kind of figurative language. In this work, we present Meta4XNLI, a novel parallel dataset for the tasks of metaphor detection and interpretation that contains metaphor annotations in both Spanish and English. We investigate language models’ metaphor identification and understanding abilities through a series of monolingual and cross-lingual experiments by leveraging our proposed corpus. In order to comprehend how these non-literal expressions affect models’ performance, we look over the results and perform an error analysis. Additionally, parallel data offers many potential opportunities to investigate metaphor transferability between these languages and the impact of translation on the development of multilingual annotated resources.

arxiv情報

著者 Elisa Sanchez-Bayona,Rodrigo Agerri
発行日 2024-04-10 14:44:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク