IUST_NLP at SemEval-2023 Task 10: Explainable Detecting Sexism with Transformers and Task-adaptive Pretraining

要約

本稿では、SemEval-2023 Task 10: Explainable Detection of Online Sexism (EDOS) について、我々のシステムを紹介する。この課題は、オンライン空間における性差別的なコンテンツを検出し、分類するための自動システムを設計することを目的としている。タスク適応的な事前学習とアンサンブル学習による、変換器ベースの事前学習済みモデルのセットを提案する。我々のシステムの主な貢献は、異なるトランスフォーマベースの事前学習済みモデルの性能を分析し、これらのモデルを組み合わせること、また、モデル適応的な事前学習のために大量のラベルなしデータを使用する効率的な方法を提供すること、である。また、その他のいくつかの戦略も検討した。テストデータセットにおいて、本システムはサブタスクA、B、Cでそれぞれ83%、64%、47%のF1スコアを達成した。

要約(オリジナル)

This paper describes our system on SemEval-2023 Task 10: Explainable Detection of Online Sexism (EDOS). This work aims to design an automatic system for detecting and classifying sexist content in online spaces. We propose a set of transformer-based pre-trained models with task-adaptive pretraining and ensemble learning. The main contributions of our system include analyzing the performance of different transformer-based pre-trained models and combining these models, as well as providing an efficient method using large amounts of unlabeled data for model adaptive pretraining. We have also explored several other strategies. On the test dataset, our system achieves F1-scores of 83%, 64%, and 47% on subtasks A, B, and C, respectively.

arxiv情報

著者 Hadiseh Mahmoudi
発行日 2023-05-11 15:29:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク