TSCheater: Generating High-Quality Tibetan Adversarial Texts via Visual Similarity

要約

ディープニューラルネットワークに基づく言語モデルは、テキスト敵対的攻撃に対して脆弱である。英語のような豊富なリソースを持つ言語が注目される一方で、国境を越えた言語であるチベット語は、その豊富な古代文献と重要な言語戦略により、徐々に研究が進められている。現在、チベット語の敵対的テキスト生成手法はいくつか存在するが、それらはチベット文字のテキスト的特徴を十分に考慮しておらず、生成された敵対的テキストの品質を過大評価している。この問題に対処するため、我々はTSCheaterと呼ばれる新しいチベット語敵対的テキスト生成手法を提案する。この手法は、チベット語の符号化の特徴と、視覚的に類似した音節は類似した意味を持つという特徴を考慮する。この方法は、デーヴァナーガリー文字のような他のアブジーダにも転用可能である。我々は、TSVSDBと呼ばれるチベット語の音節視覚的類似性データベースを利用して置換候補を生成し、貪欲アルゴリズムに基づくスコアリング機構を採用して置換順序を決定する。その後、8つの犠牲言語モデルに対して本手法を実施する。実験的に、TSCheaterは、攻撃の有効性、摂動の大きさ、意味的類似性、視覚的類似性、人間の受容性において、既存の手法を凌駕している。最後に、既存の手法によって生成され、人間によって校正された、AdvTSと呼ばれる初のチベット語敵対的頑健性評価ベンチマークを構築する。

要約(オリジナル)

Language models based on deep neural networks are vulnerable to textual adversarial attacks. While rich-resource languages like English are receiving focused attention, Tibetan, a cross-border language, is gradually being studied due to its abundant ancient literature and critical language strategy. Currently, there are several Tibetan adversarial text generation methods, but they do not fully consider the textual features of Tibetan script and overestimate the quality of generated adversarial texts. To address this issue, we propose a novel Tibetan adversarial text generation method called TSCheater, which considers the characteristic of Tibetan encoding and the feature that visually similar syllables have similar semantics. This method can also be transferred to other abugidas, such as Devanagari script. We utilize a self-constructed Tibetan syllable visual similarity database called TSVSDB to generate substitution candidates and adopt a greedy algorithm-based scoring mechanism to determine substitution order. After that, we conduct the method on eight victim language models. Experimentally, TSCheater outperforms existing methods in attack effectiveness, perturbation magnitude, semantic similarity, visual similarity, and human acceptance. Finally, we construct the first Tibetan adversarial robustness evaluation benchmark called AdvTS, which is generated by existing methods and proofread by humans.

arxiv情報

著者 Xi Cao,Quzong Gesang,Yuan Sun,Nuo Qun,Tashi Nyima
発行日 2024-12-03 10:57:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.CR パーマリンク