PHISH in MESH: Korean Adversarial Phonetic Substitution and Phonetic-Semantic Feature Integration Defense

要約

悪意のあるユーザーは、ヘイトスピーチの検出を回避するために音声の代替をますます採用しているため、研究者はそのような戦略を調査しました。
ただし、2つの重要な課題が残っています。
第一に、蓄音機の性質による音声摂動に対する脆弱性にもかかわらず、既存の研究は韓国語を見落としています。
第二に、以前の作業は、主に建築防御を開発するのではなく、データセットの構築に焦点を合わせてきました。
これらの課題に対処するために、(1)韓国のライティングシステムの音韻特性を活用するハングル(Phish)の音声情報に基づいた代替、および(2)建築レベルで音声情報を組み込むことにより、ディテクターの堅牢性を高めるセマンティック音量性の特徴(メッシュ)の混合エンコードを提案します。
私たちの実験結果は、摂動と摂動のないデータセットの両方に対する提案された方法の有効性を示しており、検出パフォーマンスを改善するだけでなく、悪意のあるユーザーが採用した現実的な敵対的行動を反映していることを示唆しています。

要約(オリジナル)

As malicious users increasingly employ phonetic substitution to evade hate speech detection, researchers have investigated such strategies. However, two key challenges remain. First, existing studies have overlooked the Korean language, despite its vulnerability to phonetic perturbations due to its phonographic nature. Second, prior work has primarily focused on constructing datasets rather than developing architectural defenses. To address these challenges, we propose (1) PHonetic-Informed Substitution for Hangul (PHISH) that exploits the phonological characteristics of the Korean writing system, and (2) Mixed Encoding of Semantic-pHonetic features (MESH) that enhances the detector’s robustness by incorporating phonetic information at the architectural level. Our experimental results demonstrate the effectiveness of our proposed methods on both perturbed and unperturbed datasets, suggesting that they not only improve detection performance but also reflect realistic adversarial behaviors employed by malicious users.

arxiv情報

著者 Byungjun Kim,Minju Kim,Hyeonchu Park,Bugeun Kim
発行日 2025-05-27 16:09:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク