Overview of the 2023 ICON Shared Task on Gendered Abuse Detection in Indic Languages


この論文は、インド言語におけるジェンダー虐待の検出に関する ICON 2023 の調査結果を報告します。
共有タスクは、オンライン テキストにおける性差別的な虐待の検出に対処します。
この共有タスクは、ヒンディー語、タミル語、インドの方言英語の新しいデータセットに基づいて、ICON 2023 の一部として実施されました。
参加者には、Twitter から取得した約 6,500 件の投稿で構成されるトレイン データセットを使用した 3 つのサブタスクが与えられました。
テスト セットには、約 1200 の投稿が提供されました。
共有タスクは合計 9 件の登録を受け取りました。
最高の F-1 スコアは、サブタスク 1 で 0.616、サブタスク 2 で 0.572、サブタスク 3 で 0.616 と 0.582 です。この論文には、その主題に起因する嫌がらせ的なコンテンツの例が含まれています。


This paper reports the findings of the ICON 2023 on Gendered Abuse Detection in Indic Languages. The shared task deals with the detection of gendered abuse in online text. The shared task was conducted as a part of ICON 2023, based on a novel dataset in Hindi, Tamil and the Indian dialect of English. The participants were given three subtasks with the train dataset consisting of approximately 6500 posts sourced from Twitter. For the test set, approximately 1200 posts were provided. The shared task received a total of 9 registrations. The best F-1 scores are 0.616 for subtask 1, 0.572 for subtask 2 and, 0.616 and 0.582 for subtask 3. The paper contains examples of hateful content owing to its topic.


著者 Aatman Vaidya,Arnav Arora,Aditya Joshi,Tarunima Prabhakar
発行日 2024-01-08 05:54:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク