要約
北アフリカのマグレブ諸国の様々なアラビア語方言のセンチメント分析(SA)タスクにおける同音異義語攻撃の影響を調べる。同音異義語攻撃により、アラビア語で書かれたデータの場合、F1スコア0.95から0.33へと変換器による分類が65.3%低下した。この研究の目的は、LLMの弱点を浮き彫りにし、倫理的で責任ある機械学習を優先することである。
要約(オリジナル)
We examine the impact of homograph attacks on the Sentiment Analysis (SA) task of different Arabic dialects from the Maghreb North-African countries. Homograph attacks result in a 65.3% decrease in transformer classification from an F1-score of 0.95 to 0.33 when data is written in ‘Arabizi’. The goal of this study is to highlight LLMs weaknesses’ and to prioritize ethical and responsible Machine Learning.
arxiv情報
著者 | Fatima Zahra Qachfar,Rakesh M. Verma |
発行日 | 2024-02-05 16:39:15+00:00 |
arxivサイト | arxiv_id(pdf) |