要約
タイトル:SemEval-2023タスク3におけるNAP:少ない方が良いですか? 説得技術の検出における(バック)翻訳をデータ拡張戦略として用いた研究
要約:
-ニュースにおける説得技術の検出は、多言語の設定であっても、データ量が少ないという課題がある。
-この研究では、(バック)翻訳をデータ拡張戦略として利用し、多言語トランスフォーマーモデルとともに説得技術検出のタスクを成功裏に遂行した。
-自動評価と人間による評価により、(バック)翻訳が性能に有効か否かを検討している。
-深い分析から、両方のデータ拡張戦略が性能を強化することがわかったが、人間によって生成されたデータと機械生成のデータをバランスよく組み合わせることが重要であることが示された。
要約(オリジナル)
Persuasion techniques detection in news in a multi-lingual setup is non-trivial and comes with challenges, including little training data. Our system successfully leverages (back-)translation as data augmentation strategies with multi-lingual transformer models for the task of detecting persuasion techniques. The automatic and human evaluation of our augmented data allows us to explore whether (back-)translation aid or hinder performance. Our in-depth analyses indicate that both data augmentation strategies boost performance; however, balancing human-produced and machine-generated data seems to be crucial.
arxiv情報
著者 | Neele Falk,Annerose Eichel,Prisca Piccirilli |
発行日 | 2023-04-27 13:33:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI