Finding Challenging Metaphors that Confuse Pretrained Language Models


メタファーは、幅広い NLP タスクに課題を引き起こすと考えられています。
このペーパーでは、VUA メタファー データセットでさまざまな NLP モデルをテストし、メタファーがさまざまな下流タスクにおけるモデルのパフォーマンスにどの程度影響するかを定量化します。
分析の結果、VUA には、下流のタスクにほとんど困難をもたらす多くのメタファーが含まれていることが明らかになりました。
分析の結果、検出されたハード メタファーは VUA と大きく対照的であり、一般的なさまざまな NLP について、機械翻訳の精度が 16\%、QA パフォーマンスが 4\%、NLI が 7\%、メタファー識別再現率が 14\% 以上低下していることが実証されました。


Metaphors are considered to pose challenges for a wide spectrum of NLP tasks. This gives rise to the area of computational metaphor processing. However, it remains unclear what types of metaphors challenge current state-of-the-art models. In this paper, we test various NLP models on the VUA metaphor dataset and quantify to what extent metaphors affect models’ performance on various downstream tasks. Analysis reveals that VUA includes a large number of metaphors that pose little difficulty to downstream tasks. We would like to shift the attention of researchers away from these metaphors to instead focus on challenging metaphors. To identify hard metaphors, we propose an automatic pipeline that identifies metaphors that challenge a particular model. Our analysis demonstrates that our detected hard metaphors contrast significantly with VUA and reduce the accuracy of machine translation by 16\%, QA performance by 4\%, NLI by 7\%, and metaphor identification recall by over 14\% for various popular NLP systems.


著者 Yucheng Li,Frank Guerin,Chenghua Lin
発行日 2024-01-29 10:00:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク