NAP at SemEval-2023 Task 3: Is Less Really More? (Back-)Translation as Data Augmentation Strategies for Detecting Persuasion Techniques

要約

タイトル:SemEval-2023タスク3におけるNAP:少ない方が良いですか? 説得技術の検出における(バック)翻訳をデータ拡張戦略として用いた研究

要約:
-ニュースにおける説得技術の検出は、多言語の設定であっても、データ量が少ないという課題がある。
-この研究では、(バック)翻訳をデータ拡張戦略として利用し、多言語トランスフォーマーモデルとともに説得技術検出のタスクを成功裏に遂行した。
-自動評価と人間による評価により、(バック)翻訳が性能に有効か否かを検討している。
-深い分析から、両方のデータ拡張戦略が性能を強化することがわかったが、人間によって生成されたデータと機械生成のデータをバランスよく組み合わせることが重要であることが示された。

要約(オリジナル)

Persuasion techniques detection in news in a multi-lingual setup is non-trivial and comes with challenges, including little training data. Our system successfully leverages (back-)translation as data augmentation strategies with multi-lingual transformer models for the task of detecting persuasion techniques. The automatic and human evaluation of our augmented data allows us to explore whether (back-)translation aid or hinder performance. Our in-depth analyses indicate that both data augmentation strategies boost performance; however, balancing human-produced and machine-generated data seems to be crucial.

arxiv情報

著者 Neele Falk,Annerose Eichel,Prisca Piccirilli
発行日 2023-04-27 13:33:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク